イントロ
GoogleのGary Illyes氏は、ブルガリアで開 催されたSERP Conf 2024でのインタビューで、「クロールされたがインデックスされていない」エラーの原因について語った。彼の洞察は、この一般的な問題に光を当て、それを解決するための貴重なガイダンスを提供します。
重要なポイント
1.内容の類似性:
- イリェス氏は、このエラーの原因のひとつがコンテンツの類似性であることを確認した。ページのコンテンツがすでにインデックスされている他のコンテンツと酷似している場合、グーグルはそのページをインデックスしないことを選択する可能性がある。
2.一般的なサイトの品質:
- ウェブサイトの全体的な品質は、インデックス作成に大きく影響します。クロールされたがインデックスされていない」ページが多い場合は、サイトの品質に問題がある可能性があります。
3.技術的な問題:
- 同じコンテンツを複数のURLで配信しているなどの技術的な問題も、このエラーにつながる可能性がある。このような問題が検出された場合、Googleのサイトに対する認識が変わる可能性があります。
4.複製:
- 重複コンテンツも大きな要因だ。グーグルは、あるページをクロールしても、より良いシグナルを持つ類似のバージョンがすでにインデックスに存在する場合、そのページをインデックスしないことを決定するかもしれない。
詳しい説明
インタビューの中でイリェス氏は、"クロールされたがインデックスされていない "というエラーは、すでにインデックスされているコンテンツとページが類似しすぎていることが原因ではないかという質問に答えた。イリェス氏は、これが一つの原因である可能性を認めたが、この問題にはいくつかの要因が絡んでいることを強調した。
粒度と複雑さ:
イリェス氏は、Google内部でのデータの扱い方に起因するこれらのエラーの分類の複雑さを指摘した。彼は、重複コンテンツは重要な要因であるが、このエラーには他にも多くの潜在的な理由があると説明した。
品質の問題:
イリーズ氏は、サイトの一般的な品質がインデックスに大きく影響することを強調した。クロールされたがインデックスされていない」ページの急増は、サイトの品質に対するグーグルの認識の低下を示唆しているかもしれない。これは、質の低いコンテンツや技術的なエラーなど、さまざまな理由による可能性がある。
技術的な問題:
ウェブサイトが誤って同じコンテンツを異なるURLで提供してしまうなどの技術的な問題も、この問題につながる可能性がある。このようなエラーは、Googleのインデックス決定を再考させる可能性がある。
サイトのシグナル
イリーズ氏は、より優れたシグナルを持つ別のサイトが同じコンテンツをホストしている場合、グーグルは代わりにそのサイトをインデックスすることを好むかもしれないと述べた。このシナリオは、オリジナルの出版社のバージョンがインデックスされないシンジケートされたコンテンツでしばしば発生する。
実践的な収穫
これらの原因を理解することで、ウェブマスターは「クロールされたがインデックスされていない」エラーをデバッグし、修正することができます。主な対処法は以下の通りです:
-
コンテンツの類似性を見直す:コンテンツがユニークで、インデックスされている既存のコンテンツと類似しすぎていないことを確認する。
-
サイトの質を高める:Googleからの評価を高めるため、サイト全体の質の向上に注力する。
-
技術的な問題を解決する:重複コンテンツやその他の問題を引き起こす可能性のある技術的な問題に対処する。
-
サイトのシグナルを監視する:特にコンテンツがシンジケートされている場合は、自分のサイトのシグナルが他のサイトと比べてどうなのかを意識しよう。
これらの部分に対処することで、Googleにインデックスされる可能性を高めることができます。