SEOを実践し、ホームページなどさまざまなWEBサイトを上位表示させ、ユーザーの流入を増やす場合は、検索エンジンの仕組みについて正しい理解が必要です。
検索エンジンは、プログラムを駆使してインターネット上に存在する数多くのWEBサイトを認知します。
検索エンジンのロボット「クローラ」と「インデクサ」は、WEBページを発見し内容を分析する役割を担います。
ここでは、クローラ・インデクサの仕組みとSEOにおける関係性について解説します。
-
参考SEOとはユーザー視点のコンテンツ重視で検索エンジンから集客する施策
続きを見る
クローラ・インデクサの仕組み
初めに、SEOを実行することでWEBページが検索結果に反映される仕組みについて、理解を深めていきましょう。
以下では、クローラ・インデクサの役割と仕組みを説明します。
クローラはWEBページのデータを収集する
GoogleやYahoo!などの検索エンジンは、インターネット上のWEBページを認識するため「クローラ」というプログラムを使い、WEBページを巡回してデータを収集します。
クローラがクローリングしながらWEBページのデータを取得すると、そのページ内から新たなリンクを抽出するため、WEBサイトの全ページを認識することが可能です。
クローリングとは、ホームページを読み込んで情報を集めることを指します。
クローラは一度データを収集したサイトを定期的に巡回し、更新データや最新情報を取得します。
SEOには自社のWEBサイトに施す「内部対策」があります。内部対策の目的のひとつには、「クローラにWEBサイトの情報を伝えること」があります。
クローラにWEBサイトの情報を正しく認識してもらうには、ブログなどの記事のタイトル・見出し・画像・ディスクリプションへの内部対策が必要です。
内部対策については、下記の記事で詳しくお伝えしています。あわせてご覧ください。
こちらもCHECK
-
SEO外部対策につながる内部リンクとは?重要である理由・やり方
続きを見る
こちらもCHECK
-
HTMLタグを最適化しよう!SEO対策に効果的な使い方や注意点
続きを見る
インデクサはWEBページのデータを解析しインデックスする
WEBページは、クローラによって認識された後、インデクサがデータを解析した上で検索結果に反映されます。
インデクサとは、クローラが認識したWEBページを解析し、データベースに保存する役割を持つプログラムです。
上述の作業を「インデックス」といいます。クローラが巡回するだけでは検索結果に反映されないため、必ずインデックスまでされることが必要です。
インデクサによってWEBページ内のテキストや画像、リンクなど要素ごとにデータが整理されます。
整理されたデータは、検索エンジンが持つ高度なプログラム「アルゴリズム」によって細かく分析される仕組みによって検索結果に反映されます。
インデクサがWEBページのデータを保存する際、公開しているWEBサイトにエラーがない状態が適切といえます。
一般的に、インデックスは「目次を作る」作業と例えられるように、キーワードに関連する項目として、記事や文章を登録していく作業のイメージとなります。
クローラビリティとインデクサビリティ
上述したように、WEBページを検索結果に表示させるためには、クローラにWEBページに来てもらい、インデクサにインデックスしてもらうことを意識する必要があります。
クローリングとインデックスのどちらが欠けても、検索結果に反映されないため、ユーザーにもWEBページを発見してもらえない結果を招いてしまいます。
Webページが表示されるためには、『クローラビリティ』と『インデクサビリティ』を意識したWEBページづくりが重要です。
ここでは、クローラビリティとインデクサビリティについて解説します。
クローラビリティとはクローリングされやすくすること
クローラが情報を収集しやすくするために、ページを最適化することを『クローラビリティ』といいます。
クローラビリティをよくして、クローラに発見されやすくすることがSEO対策の第一歩といえます。
クローラはWEB上にある膨大な数のページを日々巡回して、情報収集をしています。
クローラに発見してもらえなければ、検索結果に反映されないため、クローラに発見されやすいサイトづくりを心がける必要があります。
クローラビリティをよくするための対策として、『パンくずリスト』を設定する方法があります。
パンくずリストとは、ユーザーがサイト内のどの階層に滞在しているかをわかりやすく表示する機能です。
パンくずリストを設定することで、クローラにWEBサイトをより理解してもらいやすくなるため、クローラビリティの向上に有効です。
また、パンくずリストを設置することでサイト内の利便性も向上するため、ユーザーにも親切な設定です。
クローラビリティをよくすることで、検索エンジンとユーザーの両者から評価されるWEBサイトとなり、上位表示に期待できます。
インデクサビリティは正確にインデックスされるようにすること
クローラビリティを改善すると同時に、クローラが集めた情報をインデクサに正しく理解してもらえるようにすることも重要です。
インデクサが内容を理解しやすくサイト内を最適化することを『インデクサビリティ』といいます。
インデクサは、テキスト情報のみ読み取れるため、記事内にある画像や動画、音声ファイルの内容を理解できません。
ページに挿入した画像や動画、音声ファイルには、テキストで内容を説明する『代替テキスト(alt属性)』を設定しましょう。
代替テキスト(alt属性)には、ファイルの内容を詳細に記載すると、より検索エンジンに理解されるWEBページとなります。
また、通信トラブルやページの読み込みエラーが起きた際には、画像の代わりに代替テキストが表示されるため、ユーザーにとっても親切な設計です。
ただし、装飾のために挿入した画像は、クローラに認識させなくてもよいため、代替テキストを設定する必要はありません。
ページ内の内容に関連性の高い画像や動画に、代替テキストを設定しましょう。
そのほかの対策として、タイトルや内容などの、WEBページを構成しているものが完全に一致しているか、ほぼ同じコンテンツである『重複コンテンツ』を避けることもインデクサビリティをよくする対策のひとつです。
WEBページの情報をインデクサに正しく伝え、上位表示されるようにインデクサビリティの向上に努めましょう。
SEOを効率よく行うためのポイント
クローラ・インデクサの役割と仕組みを理解した上で、プログラムに正しく認識されるよう対策が必要です。
具体的なポイントは以下の2点が挙げられます。
- サーチコンソールでインデックス処理を行う
- 選定したキーワードから検索意図に沿ったページを作成する
こちらもCHECK
-
Googleアナリティクスとサーチコンソールの連携方法を解説!
続きを見る
上述の2点のポイントについて、詳しく見ていきましょう。
サーチコンソールでインデックス処理を行う
先述のとおりクローラは、一度認知したWEBページを定期的に巡回します。
クローラがWEBページを巡回する頻度は、一般的には2週間に1回といわれていますが、定かではありません。
WEBページをクローラにいち早く認識してもらうためには「Google Search Console(グーグルサーチコンソール)」のインデックス処理を行うのが効果的です。
サーチコンソール上でインデックス処理を行うと、WEBページの巡回をクローラに促すことが可能です。
インデックス登録をするには、まずサーチコンソールでログインします。以降の手順は、以下のとおりです。
- サイドメニューの「URL検査」をクリックし検索窓に対象のURLを入力する
- 「インデックスの登録」を行う
step
1対象のURLを入力
サイドメニューの「URL検査」をクリックし、検索窓に対象URLを入力する。
「Googleインデックスからデータを取得しています」の画面が表示されるため、そのまま表示が消えるまで待ちます。
※「URLはGoogleに登録されています」の画面が表示された場合は、登録が済んでいます。「URLがGoogleに登録されていません」の画面表示が出たらSTEP2に進んでください。
step
2インデックス登録リクエスト
「URLがGoogleに登録されていません」の画面表示が出たら、「インデックス登録をリクエスト」をクリックします。
「公開URLがインデックスに登録可能かどうかをテストする」の画面が表示されるので、そのまま待ちます。
「インデックス登録をリクエスト済み」画面が表示されたら、「OK」をクリックして画面を閉じます。
※「インデックス登録をリクエスト」したら、1~2日後に「STEP1」から同じ作業を行って「登録済み」になっているかを確認してみましょう。
「登録済み」になっていない場合は、再度「インデックス登録をリクエスト」を実行します。
選定したキーワードから検索意図に沿ったページを作成する
ホームページや自社メディアへの流入を増やすためには、検索結果で上位表示させるSEOを実装させましょう。
検索結果で上位表示をさせるには、アルゴリズムによってWEBサイトやページが評価されるよう、検索窓に入力するキーワードを選定したうえで検索意図に沿った記事やページの作成が必要です。
アルゴリズムでは主に次の3つの処理が行われ、WEBページの品質が評価されます。
1.キーワードの分析
アルゴリズムは、ユーザーが検索したキーワードの意味や意図を、高度な分析能力をもって判別します。
キーワードの処理には「自然言語処理」という仕組みが応用され、同音異義語も高い精度で認識できます。
自然言語とは、人間の言語を機械で処理し、内容を抽出することです。
具体的には「話し言葉」「書き言葉」を対象として、それぞれの言葉が持つ意味をさまざまな方法で解析する処理技術を指します。
2.キーワードの照合
検索キーワードの意図から、要求を満たすWEBページをインデクサに保存されたデータベースから抽出します。
アルゴリズムは、キーワードの意図を理解する能力が定期的にアップデートされ、ユーザーが求める検索結果に変化しています。
3.WEBページのランキング
抽出されたページの中から、有益なサイト順にランキングされ、検索結果に反映されます。
WEBページの検索順位を決める要素は200以上あり、そのほとんどが非公開のため、仮説を元に検索キーワードの意図を満たすページを作成することが、SEOにおいて大切です。
内部リンクを設置する
クローラは情報収集する際に、リンクからリンクをたどってWEB上を移動しています。
この仕組みを利用して、多くの記事にクローリングしてもらいたいページを積極的に内部リンクとして貼ることで、クローラが巡回する確率が上昇します。
または、クローリングしてもらいたいページに、ほかの記事の内部リンクを設置することも、クローラが自由に行き来できるようになるため、効果的な手法です。
内部リンクをたどってクロールが盛んに行われることで、インデックスのスピードも上昇し、掲載開始から検索結果に反映されるまでの速度も上がります。
リンクを設置する記事とリンクを貼られる記事は、関連性の高いページであることが重要です。
両記事の関連性が低いと、記事の質を下げ、検索エンジンからの評価を落としてしまう可能性があります。
関連性の高い記事を内部リンクとして設置することで、両記事の質が向上し、検索エンジンから評価され、WEBページの上位表示を狙えるでしょう。
サイトマップを検索エンジンに提出する
サイトマップを検索エンジンに提出することでクローラのWEBサイトへの理解が深まり、クローリングの効率を上げられます。
サイトマップには以下の2つの種類に分けられます。
- HTMLサイトマップ
- XMLサイトマップ
ここでは、上記2種類のサイトマップの役割と、検索エンジンに提出するXMLサイトマップについて解説します。
サイトマップの役割
サイトマップとは、WEBサイト内のページ情報を検索エンジンとユーザーに伝えるためのファイルのことです。
サイトマップには、『HTMLサイトマップ』と『XMLサイトマップ』の2種類あります。
HTMLマップはWEBサイトに訪れたユーザーが、サイト内の構造を理解しやすくするためのものです。
Webサイト内にあるコンテンツを、カテゴリーごとに整理し、表示されている一覧ページのことを指します。
一方、XMLサイトマップは検索エンジンにサイト内の構造を理解してもらうために提出するサイトマップです。
XMLサイトマップを提出することは、WEBサイトを長期的に運用していくうえで重要な工程です。
なぜなら、WEBサイトの運用している年月が経つにつれて記事が多くなり、WEBサイト内の構造が複雑になってくると、クローリングがスムーズに行えなくなる可能性があるからです。
検索エンジンにXMLサイトマップを提出し、クローラが読み取ることで、クローリングが効率的に行われるようになります。
検索エンジンに提出するXMLサイトマップ
XMLサイトマップの『XML』とは、ファイル形式の名称を指します。
XML形式は、文章の見た目や構造を記述するために、WEB制作で用いられているデータ記述用の言語です。
上述したように、Googleに提出するサイトマップはXMLサイトマップを使います。
提出するためのXMLサイトマップは、WordPressのプラグインやWEBサービスを利用することで自動作成できます。
XMLサイトマップは複数のページをまとめてつくることはできないため、クローリングされたいページのドメインごとにXMLサイトマップを作成しましょう。
作成したXMLサイトマップは、Googleサーチコンソールから検索エンジンに送信することで提出完了となります。
クローラビリティをよくするために、ページごとにXMLサイトマップを作成し、Googleサーチコンソールで登録しておきましょう。
クローラ・インデクサの仕組みを理解して上位表示をめざそう
クローラ・インデクサは、WEBページの内容を認識する役割を担うプログラムです。
クローラにWEBページを認知してもらうためには、Googleサーチコンソールでインデックス処理すると効果的です。
SEOを実行する際は、クローラ・インデックスの役割と仕組みを理解した上で、検索キーワードの意図を満たすWEBサイトやページの作成を心がけましょう。
すると、自社のWEBサイトが上位表示され、ユーザーの流入に期待できます。