30597
•
17 分で読めます
•
潜在意味インデックス付けは、インターネットが使用されるずっと前に発明された情報検索技術です。ある時点で、Google がランキング アルゴリズムの改善に着手したとき、LSI キーワードと、LSI キーワードが Web サイトの SEO に有益であるかどうかについて論争が起こりました。
この記事では、潜在意味論的インデックスの起源と LSI キーワードの概念について詳しく説明します。また、コピーライティングに使用できる LSI キーワード生成ツールをいくつか紹介します。楽しむ!
Latent Semantic Indexing (略してLSI) は、ドキュメントのコレクション内の単語間の関係を見つける数学的手法です。 LSI を使用すると、十数のテキストを比較し、トピックの点でそれらの一部が類似していると結論付けることができます。このアルゴリズムは、主要なトピックのキーワードが一部のテキストで直接使用されていない場合でも、類似性を導き出します。
言い換えると、
潜在的なセマンティック分析の必要性は、コンピューターの能力が向上し、プログラマーがユーザーの情報へのアクセスを向上させようとしたときに現れました。テキスト関連の情報処理には、より効率的な意味解析が必要でした。 LSI 技術は、テキスト分析のいくつかの問題、つまり同義語と多義性に取り組むことを目的としていました。
同義語とは何ですか?
同義語は、同じものまたは概念に対する異なる単語の存在を説明する言語用語です。たとえば、行き方については、 「ルート」 、 「道路」 、 「ドライブ」 、 「通路」などと表現するための単語がいくつかあります。
多義性とは何ですか?
多義性とは、複数の意味を持つ 1 つの単語を表す言語用語です。多義語には異なる意味がありますが、関連する意味があります。ドライブという言葉を考えてみましょう。車を運転したり、友人をパブから家まで送ったり、単に長時間運転したりすることもできます。もう 1 つは、誰かを怒らせる可能性があるということです。この言葉は、決意、旅、車の広い道、コンピューターの部品などを意味します。
同音異義語とは何ですか?
わずかに異なる現象は、単語の綴りが同じ (同形異義語) または発音が同じ (同音異義語) であるにもかかわらず、起源に関連性がなく、異なる概念を意味する同音異義語です。たとえば、動詞としてはbe or not to be が必要ですし、昆虫としては蜂があります。
これらの言語現象は、芸術や文学におけるあらゆるダジャレやユーモアの原動力です。
しかし、検索エンジンでキーワードの完全一致が機能しない主な理由は、同義語と多義性です。
LSI は、言葉遣いの多様性によって隠されたり、曖昧になったりする可能性がある、基礎となる意味構造を明らかにします。この技術を使用すると、テキストのコレクション内の複数の文書間の類似点を見つけ、検索者の問い合わせに最も関連性の高い文書を取得できます。
LSI は 1988 年に公開された特許取得済みのテクノロジです (特許は 2008 年に期限切れになりました)。
LSI は、用語と文書の行列と、一般的な線形代数手法である特異値分解 (SVD) を使用して、本文の概念的な相関関係を学習します。行列や固有ベクトルの演算に慣れていない限り、その仕組みを理解するのに時間がかかりますが、ここで簡単に試してみましょう。
この計算により、テキスト本文内の共起箇所が特定され、テキストのコレクション内の複数の文書に共通する概念を明らかにするのに役立ちます。 LSI の利点は、ノイズを除去し、非常にまばらな TDM マトリックスを、共通の構造を明らかにする低ランクの近似マトリックスに変換するのに役立つことです。 LSIの欠点は計算が複雑なことです。
これは、トピック モデリング チュートリアルの概要からの LSA 例のアニメーションです。
LSI を使用すると、用語と用語、文書と文書、用語と文書を比較できます。より具体的なケースとして、隣接する用語 (重みが最も近い用語) を見つけて、1 つの概念に密接に関連する単語のクラスターを見つけるのに役立ちます。これらは同義語だけでなく、反対語や、主要なトピックと一緒に使用されることが多い単語である場合もあります。ワードクラスタリングLSIにより文書の検索や分類に効果を発揮します。
LSI キーワードは、ページの主要なトピックのキーワードに意味的に関連する単語であり、さまざまな同様のテキストで見つけることができます。
LSI キーワードとは何かを簡単に理解するために、 「気候変動」などのランダムなクエリを見てみましょう。まず、その単語フレーズからどのような連想があるかを考えてください。
検索バーに入力すると、さまざまな種類のページが大量に表示されます。 Googleは、注目のスニペットでこの用語の定義をWikipediaから引き出し、気候変動に関連する最も重要な用語である「氷の融解」、「海洋温暖化」、「海面上昇」、 「海洋の酸性化」を太字で強調している。 。
検索結果ページの下に行くと、 「地球温暖化」 、 「温室効果ガス排出量」など、さらに関連性の高い用語がいくつか見つかります。これらは、ほとんどのテキストで主要なキーワード用語の隣に表示される単語やフレーズです。
LSI に関する難しい質問は...
Google が LSI キーワードを使用しているかどうかを尋ねるすべての人に対して、Google 代表の John Mueller からきっぱりと短い返答が1 つあります。
では、なぜ Google が潜在意味分析と関連付けられているのでしょうか? Google の検索エンジンが多義語と同義語を区別していることは確かです。人気のあるクエリの場合、SERP 上の少なくともいくつかの結果は、トピックのほぼ同じ側面をカバーしているはずです。これは、Google がキーワードを適切に識別し、多義語を区別し (もちろん指定した場合だけでなく、検索履歴にも基づいて)、さらには解釈するためです。最も関連性の高いテキストを描画するというクエリの意図。
さらに、Google は毎日、これまでに見たことのない検索の 15% を取得しています。それらはどのように処理されますか?
実のところ、LSI がそのアルゴリズムのどの段階で実装されたかを示す、LSI キーワードに関する Google の研究論文にはほとんど言及することができません。確かに、現在 Google は、より高度な自然言語処理アルゴリズムを使用して、拡大し続けるウェブをスキャンしています。 Bill Slawski は、Google が検索に LSI をほとんど使用しない理由を ここで明らかにし、2017 年時点の特許を引用し、例として新しい Google アルゴリズム RankBrain がワード ベクトル アプローチに基づいていると述べています。
最新のアルゴリズム更新により、Googleは BERT を使用して、ユーザーのクエリに対する検索結果の関連性を向上させています。自然言語処理用のニューラル ネットワークは、パッセージのランキングやビデオの深い意味論を理解するために使用されますが、これは LSI よりもはるかに複雑であると思われます。
関連記事Google の MUM: 検索の更新と SEO への影響
LSI はインターネットの黎明期に発明されました。今日のように大きなウェブでは、LSI は十分ではなく、実用的ではありません。
留意すべき点の 1 つは、LSI は、確率的潜在意味分析、主成分分析、潜在ディリクレ割り当て、Word2Vec などと並んで、意味分析の多くの手法の 1 つにすぎないということです。
LSI 技術は現代の検索ニーズには古すぎて単純すぎるとして却下されていますが、「LSI キーワード」という用語は、コンテンツ マーケティング担当者によってページ上で行われる最適化作業の範囲を説明するために使用されます。では、SEO における LSI キーワードの価値は何でしょうか?
LSI キーワードの主な利点は、LSI キーワードを使用してページ上の SEO を改善できることです。 LSI ツールは、Google のアルゴリズムを微調整することを目的としたものではありません。彼らは、SERP ですでに利用可能なテキストに基づいて、自然に並んで出現する単語やフレーズを見つけるテキスト分析に焦点を当てています。
LSI を使用すると、意味的に関連したキーワードを使用してコンテキストを強化できます。 LSI キーワードを使用すると、クエリの自然なコンテキストを作成し、トピックをより深くカバーするのに役立ちます。コンテンツ作成における一種のヘルパーとして扱うことができます。
「LSI コピーライティング」という用語は、コンテンツ マーケティングにおいて、コンテンツに関連用語を追加するプロセスを指すために使用されます。大まかに言えば、SEO コピーライティングは、時代遅れで不自然なキーワードを詰め込む手法から遠ざかる傾向があります。むしろ、ユーザーフレンドリーなコンテンツを作成することに重点を置いています。コピーライターは自然に書かれたテキストを作成し、ユーザーに付加価値をもたらす必要があります(検索エンジニアが目指しているのと同じことです)。
したがって、LSI キーワードについて話すときは、コンテンツを改善するために追加できる関連キーワードを見つけることを意味します。その場合、私たちはそれをコンテンツ作成者が使用するマーケティング概念として話します。
まず考えてみましょう。あなたが専門家であれば、記事で展開できるアイデアがたくさんあるでしょう。アイデアがなくなったらどうしますか?キーワード ツールを使用します。
LSI キーワードを見つけようと思ったときに最初に思いつく方法は、Google のキーワード候補を使用することです。ただし、Google の通常のキーワード ツールについて話す場合、Google のアルゴリズムは潜在的なセマンティック インデックス作成に関するものではないため、LSI キーワード ジェネレーターと呼ぶことはできません。
Google オートコンプリートがキーワード発見に最適な情報源であることは間違いありませんが、LSI キーワードが必ずしもそれを意味するとは限りません。また、ロングテール キーワードとセマンティック LSI キーワードの違いにも注意してください。ロングテール キーワードにはすでにメイン キーワードが組み込まれており、コンテンツに適合する可能性が高く、ターゲット キーワード フレーズとして追跡する必要があるでしょう。一方、LSI キーワードにはターゲット キーワードがまったく含まれていない場合もあります。
SERP の下には、 「People Always Ask」ボックスとして知られるユニバーサル検索結果が常に表示されます。この場所では、意味的に関連した素晴らしいトピックがいくつか提供される可能性が高くなります。
箱を開けると、さらに多くの質問と回答が表示されます。表示される質問が多いほど、Google が提案する質問も増えます。ただし、提案されたトピックは、中心となるテーマからどんどん離れていきます。
PPA ボックスで見つかる手がかりは、モバイル音声検索や FAQ ボックスに最適化するための LSI キーワードの優れた選択肢です。
こちらもGoogleの無料キーワード生成ツールです。検索結果ページの下に移動して、関連検索結果を調べます。主な検索語の隣に最も頻繁に表示されているトピックです。同様の検索を行うと、主要なコンテンツに追加して記事をより深くするための優れたサブトピックがいくつか見つかります。同義語や関連用語は、コンテンツを充実させる優れた方法です。
Google 画像検索は、ラベルを利用してキーワードを簡単に検索するもう 1 つの方法です。このツールは、セマンティクスによってターゲット キーワードと密接に関連しており、画像結果に豊富に表示される、最も人気のあるショートテール キーワードを提案します。
関連記事: 20 以上の無料キーワード調査ツール
学術研究用のシンプルな LSI キーワード生成ツールは、Excel のアドオンである XLSTAT です。 XLSTAT では、試してみる 2 週間の無料トライアルと、文書用語マトリックスに LSI を適用する方法を示すデモスプレッドシートを提供しています。
まず、テキスト内の単語のバイナリ値を使用して DTM を作成する必要があります。次に、Excel で XSTAT をアクティブにして、[高度な機能]に移動し (+ ボタンを押して)、 [テキスト マイニング] > [潜在セマンティック分析]を選択します。データに必要な設定に進み、 「OK」をクリックして適用します。
このツールは、LSI ツールがデータから抽出したトピックのリストを提供します。結果の品質を迅速に解釈するために、このツールはスクリー プロットを生成し、固有値と累積変動パーセンテージを介してトピックの重要性を測定します。用語間および文書間の関係の視覚化もあります。
LSI Graphは、それ自体が物語る優れたセマンティック キーワード ツールです。 1 日あたり 10 件の検索を無料で実行できます。 Web サイトにアクセスし、シード キーワードを貼り付けるだけで、LSI キーワードのリストが表示され、最も有望なキーワード フレーズを選択するのに役立つ SEO 統計が表示されます。その結果、より多くのトピックや機能を追加してコンテンツを充実させるためのアイデアが数多く得られます。
LSI Graph では、キーワードの検索ボリューム、クリック単価、および期間にわたる傾向を確認できます。 LSIGraph は、潜在意味値 (LSV) として知られる独自の測定を使用して LSI キーワード検索を実行します。右側のワークスペースには、すぐにチェックアウトできるアクティブなリンクが付いたパフォーマンスの高いコンテンツが表示されます。
LSI Graph は、一括キーワード管理やセマンティック ライター ツールなどのプレミアム機能も提供します。このツールを使用すると、アプリ内のコンテンツを最適化し、LSI キーワードを生成してコンテンツの横に表示したり、単語数やキーワードの密度などを測定したりできます。実際、Semantic Writer はリサーチに特に重点を置き、SEO コピーライターに支援を提供します。 LSIのキーワード。
Keysearch は、コンテンツの LSI キーワードを検出するためのもう 1 つの無料ツールです。このツールの背後にあるキーワード検索アルゴリズムは、主要なキーワードについて Google 検索結果の最初のページを調べ、ランキング ページ上のすべてを分析して、その中で最も頻繁に使用されている単語やフレーズを見つけます。
繰り返しますが、検索傾向、CPCコスト、さらにはキーワードのSERPでランク付けされているドメインの強さなど、すべてのキーワード調査統計をリンク、オーガニックトラフィック、ソーシャルメディアの人気とともに取得できます。
Keysearch は、詳細な分析機能アルゴリズムを使用するコンテンツ アシスタント ツールを提供します。これにより、LSI キーワードの検索に別のレベルが追加されます。このツールには、Google の関連検索に加えて、Google の最初の結果の上位キーワードが含まれています。このようにして、Web サイトに最もオーガニックなトラフィックを集める最適なページの最も収益性の高いキーワードを見つけることができます。
したがって、Keysearch は、リサーチ用のキーワード ツールの機能と、SERP 分析に基づいたコンテンツの作成を支援するコンテンツ作成ツールの機能を組み合わせています。これは、上位の結果、Google の関連検索、質問ボックスからの自動分析によって抽出された LSI キーワードを生成し、コンテンツに追加するシンプルで簡単な方法です。
Content Editor は、サイト クローラーとコンテンツ最適化アプリの機能を 1 つに組み合わせた SEO PowerSuite ソフトウェアのツールである WebSite Auditor の一部を構成しています。コンテンツ作成については、WebSite Auditor には個々のページを監査する別のモジュールと、アプリ内でページを最適化するスマート ライティング アシスタント ツールがあります。
LSI キーワードを見つけるには、WebSite Auditor を起動し、 [Page Audit] > [Content Editor]モジュールに移動します。 + ボタンをクリックして、最適化するページ (既存のページまたは新しいページ) の URL を追加し、ページのターゲット キーワードの追加に進みます。
コンテンツ エディター ツールは、上位ページの SERP を分析し、ページ上の最適化のヒントを提供します。
メイン ウィンドウには、コンテンツを作成し、アプリ内で最適化スコアが向上していることを確認できる編集スペースがあります。
あるいは、コンテンツ作成者向けに、推奨事項を PDF ファイルにエクスポートし、他の執筆ツールで使用するために渡すオプションもあります。
キーワード数フィールドは編集可能です。ページ上の既存のキーワードの頻度と、使用するキーワードを増減して改善する方法を確認できます。このフィールドは手動で編集できます (LSI キーワードを手動で追加することもできます)。
WebSite Auditor には、 「Term Frequency — Inverse Document Frequency」を表す特別な TF-IDF ツールがあります。 TF-IDF は、キーワード フレーズの重要性を、大規模なドキュメント セット内の用語の頻度と比較することによって測定します。基本的に、このコンテンツ分析手法は、SVD が適用される前の LSI と同じ手順に従います。 LSI はテキストのコレクション内のどの文書にどのトピックが共通しているかを見つけますが、TF-IDF は単にそれらの用語に重みを付けます。
コンテンツ エディターの TF-IDF ツールの利点は、単語の使用状況を明確に視覚化されたグラフで表示できることです。競合他社のページの平均キーワード数を表示し、あなたのページで使用すべきキーワード数を計算します。クイック提案ツールは、キーワードの詰め込みを避けるために、新しいキーワードを追加するか、一部のキーワードの使用を減らすことを推奨します。
コンテンツ エディターは、競合他社のコンテンツから取得され、TF-IDF パラメーターでフィルターされた、コンテンツ内で使用する推奨キーワード数を提供します。競合他社のリストを展開すると、URL と、ターゲット キーワードのオーガニック検索からページが獲得したトラフィックを確認できます。ツール内で直接ページのプレーンテキスト バージョンをプレビューしたり、ツールからのクイック リンクを使用してサイトに進むことができます。
コンテンツ分析が完了すると、このツールは、Google SERP から直接取得した、コンテンツ内で検討すべきトピックや質問を提案します ( 「人々も尋ねる」セクション)。これは、より多くのトピックのアイデアを思いつき、主要なテーマをより深くカバーするのに役立ちます。
新しいコンテンツを追加し続けると、全体の単語数に対する各キーワードの重みが変化します。特別なWord クラウドウィジェットは、コンテンツ内のキーワードの重みを示します。
関連する単語やフレーズに言及すると、ランキングが向上しますか?厳密には違いますが、効果は保証されておりません。関連するキーワードをコンテンツに追加してトピックを拡張し、より深く取り上げます。その間、ページにはより多くのキーワードが表示され、ターゲット キーワードは強化されたコンテキストによってサポートされます。検索アルゴリズムにより、ページが対象とする追加のクエリが明らかになる場合があります。これにより、サイトへの関連性の高いオーガニック トラフィックが増加し、オンライン全体の可視性が向上します。しかし、ページ上の最適化に最適な追加キーワードは何でしょうか?
現在、検索エンジンが LSI を使用しているかどうかに関係なく、LSI キーワードの概念は、コンテンツ作成を支援するために SEO によって使用されています。 LSI キーワードの役割を理解すると、キーワード戦略の一部として LSI キーワードを効果的に組み込むことができます。 Google のアルゴリズムでは何百ものランキング要素が使用され、コンテンツが王様であることに注意してください。
どのようなキーワード検索ツールやテクニックを適用する場合でも、高品質のコンテンツを作成することに集中してください。優れたコンテンツはユーザーの投票を獲得し、検索エンジンがそれを認識するため、長時間読まれることの価値を疑う必要はありません。