Googleにインデックスされない原因とは?対策方法も紹介
Googleの情報取得能力は非常に高く、インターネットがつながっていれば、ほとんどのページがインデックスされるといっても過言ではありません。しかし、Webサイト全体、もしくは一部のWebページで検索流入数が極端に少ない場合、Googleにインデックスされていない恐れがあります。
当記事では、Googleのインデックスの意味やインデックスされているか確認する方法、インデックスされない場合の原因や対処法について解説します。
1.そもそもインデックスとは?
SEOにおけるインデックスとは、WebページがGoogleやBingなどの検索エンジンに登録されることです。厳密に言えば、Webページに記載されたテキストや画像、動画などを検索エンジンが解析し、データベースに登録することを指します。検索エンジンにWebページが登録されることは「インデックスされる」とも表現されます。
検索エンジンの検索結果は、インデックスされたすべてのWebページの中から、検索ワードと関連性が高いものを順に表示するという仕組みです。しかし、そもそも検索エンジンにインデックスされなければ、ユーザーが検索しても検索結果に表示されません。SEOで検索上位表示化を目指すには、前提としてWebページがインデックスされる必要があります。
1-1.インデックスされるまでの流れ
Webページは、以下の3つのステップを経てインデックスされます。
1 | クロールされる |
---|---|
「クローラー」と呼ばれる自動プログラムがWeb上を巡回し、Webページのテキストや画像・動画などをダウンロードします。 |
2 | インデックスされる |
---|---|
Webページのテキスト・画像・動画などを解析し、情報をデータベースに登録するステップです。 |
3 | 検索結果に表示される |
---|---|
ユーザーが検索エンジンで検索すると、関連するキーワードによって検索結果に表示されるようになります。 |
重要なのは、Webページが正しく解析されるように、検索エンジンにとって分かりやすい記述でWebページを作成することです。Webページの内容はユーザーにとって分かりやすいことが大前提ですが、検索エンジンにとってもフレンドリーであることも同じくらい大切と言えるでしょう。
1-2.インデックスされるまでの時間
Webページがインデックスされるまでの時間は、一律で決まっているわけではありません。インデックスされるまでの期間はサイトやページによって異なり、公開してから数時間で行われる場合もあれば数か月かかるケースもあります。
Googleではサイトマップの送信やインデックス登録のリクエストを行った後、最低でも1週間待つことを推奨しています。サイト公開後などに何日かインデックスされなくても、焦らずに1週間は待ってみるとよいでしょう。
インデックスは、質のよいコンテンツを発信しているWebページや毎日更新されているサイトなどで早く行われやすい傾向があります。反対に、更新頻度が低いWebページや、サーバー側に技術的な問題が発生しているWebページなどはなかなかインデックスされない恐れがあります。ただし、検索エンジンのシステム側の都合でインデックスが遅れるケースもあるため、「何をすれば絶対に早くインデックスされる」と一概には言えません。
2.インデックスされない原因
Webページを公開しても、何らかの理由でいつまで経ってもインデックスされないケースもあります。Webページがインデックスされていないことに気づいた場合は、適切な対策を取ることが大切です。
どのような対策を取るか決めるために、まずはインデックスされていない原因を知ることが重要となります。以下ではWebページがインデックスされない原因として考えられる代表的なケースを6つ紹介するので、参考にしてください。
2-1.新しくページを作成したため
新規Webページを作成した場合、まだクローラーが来ておらず、URLが発見されていないケースが考えられます。
Webページを作成したばかりのタイミングでは、検索エンジンにはドメイン情報などが何も届いていません。クローラーはインターネット上に貼られたリンクを辿ってURLを検出しますが、新規ドメインのWebページは外部サイトとリンクでつながっていないケースが多いです。そのためクローラーから発見されにくく、インデックスされるまでに時間がかかるケースがあります。
2-2.ペナルティを受けているため
Googleなどの検索エンジンは、検索順位の不当な操作などに関してガイドラインを設けています。Webページがガイドラインに違反している場合、ペナルティとして検索順位が低下したり、インデックスを削除されたりするため注意が必要です。
具体的には、以下の内容に該当する場合、ペナルティを受ける可能性が高くなります。
- コンテンツの自動生成
- クローキング(ユーザーと検索エンジンに別々のコンテンツを提供する行為)
- オリジナルのコンテンツが存在しないページの作成
- キーワードの乱用
- 隠しテキスト・隠しリンク
- 不正なリダイレクト
上記は一例にすぎないため、気になる方は検索エンジンの公式ガイドラインやポリシーを確認してみましょう。
2-3.canonicalタグによって制御されているため
canonicalタグでほかのページを正規のページとして指定している場合、非正規ページはインデックスされない可能性が高くなります。
canonicalタグはURL正規化に用いられるものです。canonicalタグを使うと、複数のURLで1つのページを表示させたり、重複ページがある場合に指定した1つのURLに情報を集めたりできます。つまり、canonicalタグを振ったページではなく指定先のURLが評価されるため、canonicalタグを振ったページ自体はインデックスされなくなります。
2-4.robots.txtで制御しているため
robots.txtとは、クローラーに対して、サイトのどのURLにアクセスしてよいかを伝えるためのファイルです。クロールしてほしいWebページに誤ってクロール拒否の設定をしている場合、インデックスしてもらえない可能性が高いため注意しましょう。
2-5.コンテンツの品質が低いため
検索エンジンは、ユーザーが求める情報を的確に提供するコンテンツを高く評価し、上位表示させます。具体的には、専門性・経験・権威性・信頼性の4つの要素を高い水準で満たすWebページほど高評価を得られる傾向です。
一方、Webページのコンテンツの品質が低い場合や専門性に欠ける場合は、検索エンジンから有用性が低いと判断され、インデックスに影響を及ぼします。
2-6.コンテンツが重複しているため
サイト内でWebページ同士の内容が重複している場合、片方のページしかインデックスされない可能性があります。内容が同じであれば、どちらか片方が検索結果に反映されれば十分だと判断されるためです。
また、サイトの種類や構成によっては、意図しないところで大量の重複ページが生成され、検索サイトにコンテンツが重複していると判断されるケースもあります。
3.インデックスの確認方法
作成したサイトやWebページがインデックス済みかを確認する方法は以下の2種類です。
- 「site:」検索で確かめる
- Google Search Consoleで確かめる
「site:」検索は簡易的な確認方法であり、Google Search Consoleはインデックスの状況を全体的に把握する方法となっています。それぞれの詳細や具体的な手順を紹介するので、参考にしてください。
3-1.「site:」検索で確かめる
「site:」検索は、検索エンジンの検索窓を使ったインデックスの確認方法です。検索窓に「site:」と入力し、続けてインデックスを確認したいWebページのURLを入力して検索をかけてください。検索結果に表示されればインデックスされていることが、表示されなければインデックスされていないことが分かります。
ただし、「site:」検索はインデックスの確認方法としては大雑把なもので、検索結果に表示されたページが正確にインデックス登録されているかは不確かです。「site:」検索はおおよそのインデックス数を調べたい場合に利用するとよいでしょう。
3-2.Google Search Consoleで確かめる
Google Search Consoleを利用したインデックスの確認方法は、「URL検査」と「カバレッジ」の2種類です。
URL検査の場合は、Google Search ConsoleにログインしてURL検査をクリックし、確認したいページのURLを入力しましょう。「URLはGoogleに登録されています」と表示されれば問題なくインデックスされていることが分かります。
カバレッジの場合、Google Search Consoleにログインして、該当URL・カバレッジの順にクリックしてください。インデックスされていないなどの問題がある場合、詳細なエラー内容が表示されます。
4.インデックスされる方法
Webページがスムーズにインデックスされるためには、クローラーがページを認識しやすいよう配慮することが大切です。少しでもSEOで有利に働かせたい場合は、インデックスされるための方法を積極的に試すとよいでしょう。
今回は、Webページがインデックスされるための方法を5つ解説します。
4-1.サイトマップを送信する
XMLサイトマップとは、Webページの情報などをクローラーに知らせるためのファイルのことです。XMLサイトマップを送信することで、漏れなくクロールを促すことができます。
XMLサイトマップを作る場合、「sitemap.xml Editor」などの外部サイトを利用して自動生成するのがおすすめです。XMLサイトマップを作成したら、Google Search Consoleからサイトマップを追加・送信しましょう。すると、クローラーがサイトマップの記述情報に従って定期的に巡回してくれるようになり、インデックスされやすくなります。
4-2.Google Search Consoleからインデックス登録をリクエストする
Google Search Consoleでインデックス登録をリクエストするのは、Webページのインデックス対策として特に効率的な方法です。Google Search ConsoleでURL検査し、インデックスされていなかった場合、同じページからリクエストを送信できます。リクエストを送ることで、クローラーに「ここに新しいページがあります」と申請することが可能です。
あくまでリクエストなので必ずインデックスされるとは限りませんが、インデックス登録を促す方法としては比較的効果が見込めるものと言えます。
4-3.内部リンクを集める
検索エンジンのクローラーは、基本的に既存サイトに貼られたリンクを辿ってページを見つけます。そのため、すでにインデックスされているWebページからリンクを飛ばすことが、インデックスされるための近道です。
内部リンクが適切に貼られているサイトであれば、クロールが適切に行われ、インデックスが促進されます。新しくコンテンツ制作を行う際には、関連するページがないかを考え、適宜内部リンクを挿入するのがおすすめです。
ただし、インデックスされるために関連性の低いページ同士をリンクでつなぐと逆効果になるため注意してください。
4-4.サイト・コンテンツの質を高める
更新頻度が著しく低いサイトの場合、クローラーが何度来ても新しい情報を獲得できないため、クロールされる頻度が下がります。そのため、価値のあるコンテンツを多く発信し、クロール頻度を上げることが重要です。
また、サイトやコンテンツの品質を向上させ、検索ユーザーにとっての有用性を上げることで、優先的にインデックスされやすくなります。具体的には以下のような対策を取るのがおすすめです。
- 明瞭かつ適切なページタイトルをつける
- 画像・動画に代替テキストをつける
- サイトの表示速度を上げる
- モバイル端末での閲覧に対応する
4-5.robots.txtを確認する
robots.txtでクローラーをブロックしているURLはクロールされないため、インデックスもされません。インデックスしてほしいURLに誤ってクロール拒否の設定をしている可能性があるため、一度robots.txtを確認しましょう。
robots.txtの確認はGoogle Search Consoleで行います。robots.txtテスターツールを開き、確認したいURLを入力して「テスト」をクリックすることで、アクセスの許可状況を見ることが可能です。「disallow(クロール拒否)」の指示が入っている場合は削除してアップロードしなおしましょう。
また、サイト内に「noindex(インデックスさせたくない)」が実装されていないかも確認するのがおすすめです。実装されていた場合は当該部分を手動で削除し、再クロールのリクエストを送信してください。
まとめ
Googleにインデックスされない原因の大半は、ページの設定を誤っているところにあります。重複ページを放置したり、Googleが定めるガイドラインに違反したりすることも、インデックスされない原因です。
まずは、各ファイルやページの設定で誤った記述がないかを確認し、重複ページがあればURLの正規化を行いましょう。すべてのページに正しくリンクを貼り、コンテンツ内容の質が高いWebサイトを作成すれば、インデックスされない事態を避けられるでしょう。