Googleサーチコンソールの機能のひとつ「インデックスカバレッジ」というものをご存知でしょうか。
インデックスカバレッジを使用すると、インデックス登録されているページやされていないページ、されていなければその修正方法を確認することができます。
目次
インデックスカバレッジとは
インデックスカバレッジとは、Webサイト内のインデックス登録がされているかどうかの状況が確認できるGoogleサーチコンソールの機能です。
インデックスというのはGoogleに認識されているかという意味で、インデックスが有効でなければGoogleの検索では表示されないことになってしまいます。SEO対策するためにもインデックスを有効にすることが必須になってきます。
なおGoogleサーチコンソールとは、Googleが無料で提供しているGoogle検索結果でもサイトの掲載順位を監視、管理、改善するサービスです。
最新情報をいち早くお届け!
無料会員登録していただくと、
会員限定の特別コンテンツ記事を最後まで
読むことができます!
その他、更新情報・イベント情報を
お届けいたします。
インデックスカバレッジのステータス
インデックスカバレッジのステータスは、Googleサーチコンソールの左サイドにある「ステータス」の中の「インデックスカバレッジ」をクリックすると「エラー」「有効(警告あり)」「有効」「除外」の4つからそれぞれのステータスに該当するページ数を確認することができます。
各ステータスの説明は以下となります。
エラー
ページのインデックスが有効ではありません。ページをインデックスするためには何かしらの対処が必要となります。
有効(警告あり)
インデックスにもともと登録されているものか、最近まで登録されていたページが含まれます。
有効
ページは正常にインデックスされています。
除外
ページはインデックスが有効ではありませんが、エラーではありません。除外に関しては特に問題があるわけではありませんので、何かをする必要があるわけではありません。
インデックスカバレッジステータスのエラー
「エラー」が検出されている場合、サイトマップで送信したページか、それ以外のページかを確認します。「すべての既知のページ」が選択されているので、「すべての送信済みページ」に変更しエラーが消えるかを確認しましょう。消えた場合はGoogleが勝手に検出したURLでエラーが発生したということになります。
「すべての送信済みページ」でエラーが表示される場合は速やかに対処をしてください。
5xxエラーの発生条件と対処
5xxエラーは、サーバー設定を間違えたりサイト内部の問題という場合が多くphpなどのプログラムを見直し、修正が必要になります。
5xxエラーの対処は、どの頻度で発生するかを確認してください。
5xxエラーがたまにしか発生しない場合
頻度を確認し、ログなどから原因を見つけ出します。レンタルサーバーは仮想システム、マルチアカウント対応のアプリケーションなど複数のものを動作させているため、あるアカウントがCPU能力を占有してしまったり、バスを占有したりすると問題が発生する可能性があります。
5xxエラーが常に発生する場合
常に発生する場合は、問題となっている原因を追求し除去してください。該当のURLで毎度5xxエラーになる場合はミスなどの原因が多く対処も簡単です。
404,ソフト404の発生条件と対処
404,410は、「コンテンツが見つかりません」という意味を表しています。
それではソフト404というのはなんなのでしょうか。
ソフト404というのは、数字から上記の「コンテンツが見つかりません」ということがわかります。ですが、サーバーからはエラーページを表示していないことになっているということです。
例えば、あるWebサイトで何かの情報を検索するとします。そのサイトに検索した情報がなければ404のエラーになり「コンテンツが見つかりません」と表示されることになります。そこで404のエラーページを設定していないと通常通りエラーページは表示されますが、サーバーには404エラーページではなく、リクエストに応答したページを表示していることになり404と認知されないことになってしまいます。
ユーザーにとってはあまり害があることではありませんが、存在していないWebページをクロールすることで存在しているWebページのクロールが遅くなってしまったりと悪影響が出てしまうため注意したいエラーになります。
ちゃんとレスポンスを確認し、リクエストが見つからない場合は404ページ、ある場合はそのページに応答(200)と表示されるようにしましょう。
クロールとは、クローラーというインターネット上に置かれている情報を集めるロボットが新しいWebページ、更新されたWebページの情報を自動的に検出し、スキャンするということです。
robots.txtによってブロックされましたの発生条件と対処
まずクローラーは1度のスキャンで全ての情報を読み取る訳ではありません。
そこでrobots.txtを使用してWebページに必要なデータの範囲を命令することができます。そこでエラーが起きた際は、robots.txtでクローラーをブロックしていてこのエラーが表示されている可能性があります。
robots.txtの確認と修正が必要になります。
インデックスカバレッジステータスの有効(警告あり)
有効という文字が使用されていますが、インデックスが有効にならなかったものも含まれている可能性があります。警告内容は以下となります。
robots.txtでクロールを阻害
クロールが阻害されるとインデックスするのは難しくなります。しかし、リンクされているページ、サイトが多い場合ブロックされていたとしてもクローラーが別のサイトなどから巡回してしまうとインデックスされてしまうことがあります。
metaタグなどでnoindexを指定
Webページをインデックスさせたくない場合、metaタグなどでnoindexを指定する必要があります。また、noindexとrobots.txtによる阻害を2つ設定した場合はnoindexと書かれた文をクロールできないため逆にインデックスされてしまいます。
インデックスカバレッジステータスの除外
除外されているURLはインデックスに登録されません。Googleからの除外などといった問題がありインデックスされていません。
クロールエラー
クロールエラーはクローラーが該当URLをクロールした時に、4xx/5xxといったエラーでクロールできなかった場合に発生するレポートです。
まずはURLが正しいかや、正しくアクセスできるかなどの確認が必要です。
canonicalタグありの代替ページ
canonicalタグの使用で、本来評価してもらいたいページが重複ページとして認識されているため除外されています。この項目に該当するページは対処する必要がありません。
canonicalタグなしはページが重複している
canonicalタグが設定されていなく、Googleから重複と認識されています。canonicalを設定する、ページを削除するなどの対処が必要となってきます。
法的申し立てによりページが削除された
著作権違反、知的財産権の侵害をしなければ起きることはありません。
法的申し立てによりページが削除された
リダイレクトを正しく設定してある場合はその内容がレポートされます。意図的ではないリダイレクトが発生した場合は、ハッキングなどの可能性が考えられますので、トラブルシューティングに応じて、対応をしてください。
インデックスステータスを理解して正しく対処しよう
自分の記事、サイト、ページなどをしっかり他の人にも見てもらうためにインデックスを有効にすることは重要です。突然ある日にインデックスが無効になってしまうこともあるようなので、定期的にチェックをしていきましょう。
- 最新記事