グーグルのサーチクオリティ担当者が答えるグーグル検索Q&A
グーグル検索の基本、クローリング、インデックス、サイトマップなどの質問に回答 | グーグル検索公式Q&A #1

グーグル検索の基本「クローリング」「インデックス」「サイトマップ」などの質問に回答
グーグル サーチクオリティチーム 2012/3/2(金) 8:00 tweet44このエントリーをはてなブックマークに追加 印刷用
グーグルのサーチクオリティ担当者が答える“グーグル検索Q&A”

今回は、グーグル検索の基本である「クローリング」「インデックス」「サイトマップ」など、次の3つの質問にお答えします。

  • 404エラーのページを放置するとサイトに悪影響を与える?
  • サイトマップはこまめに更新したほうがいい?
  • 日本語ドメイン名のキーワードは変換後も理解されている?

詳しくは以下をご覧ください。

404エラーのページを放置するとサイトに悪影響を与える?

リニューアルで削除したページが1年ぐらいたってもクロールされ続けていて、404が発生しています。代替ページがないため、301リダイレクトの対象にならないのですが、クロール頻度に悪影響はないのでしょうか。404対象ページをrobots.txtでクロール対象にしないなど、対応が必要ですか。

404を返しているページに何度もクローラーが訪れる理由は、そのページに404が設定されたことに間違いなどがなく、実際にそのページが確かに消えていることを確認するためです。この期間は比較的長く、場合によっては数か月間もクロールされ続ける場合があります。

ここでお伝えしておきたいのは、このような存在しないページへのクロールエラーは、一般的によく見られることであり、通常特に気にすることはありません。特に悪い影響はありませんので、404対象ページをrobots.txtでクロール拒否する必要はありません。また、クロールエラーについては「ウェブマスター ツール」でも検知することが可能です。

詳しい情報は、Google ウェブマスター向け 公式ブログの記事「404 はサイトに悪影響を与えますか?」をご覧ください。さまざまな404の例を解説しています。

ウェブマスター ツールのクロールエラーページの例
ウェブマスター ツールのクロールエラーページの例。404が返されているときには、なぜ404が発生しているのか、原因を調査することが大切。

サイトマップはこまめに更新したほうがいい?

サイトマップの有無が、検索エンジンの評価に与える影響はどの程度でしょうか。ないよりはあった方がいい程度ですか、それともこまめに更新するのがいいのでしょうか。

サイトマップに関しては、いくつかご質問をいただきましたが、まずはヘルプ記事「サイトマップについて」をご覧いただければと思います。

サイトマップは、検出が難しいサイトのページの情報をGoogleにわかりやすく提供するための手段です。簡単に言うと、ウェブサイト上にあるページのリストのことです。

Googleの検索エンジンは、クローラーを使ってページ上のリンクをたどり、サイト内にどのようなページがあるかを把握しています。多くの場合、サイト内のページは自動的に検出されますが、サイトの構造やページ内のリンクの構造によっては、なかなか発見されないページやクロールされにくいページが生じるケースがあります。

そこで役立つのがサイトマップです。サイトマップを利用すると、Googleやその他の検索エンジンは、サイト上のすべてのページのURLを把握することができます。また、サイトマップにはURLの更新日時を含めたり、画像やビデオコンテンツの情報を追加することも可能です。そのため、これまで検索結果に表示されなかったものが表示されるようになる可能性がありますので、サイトマップが与える影響は、大きいと言えるでしょう。

サイトマップの更新頻度については、サイトの内容に変更がないのなら更新していただく必要はありませんが、内容が更新された場合や新しいページが追加された場合は、サイトマップも更新することをおすすめします。

日本語ドメイン名のキーワードは変換後も理解されている?

日本語ドメイン名に含まれるキーワードは、Punycode(ピュニコード)※1でエンコードされていても理解できるというのは間違いないですか。日本語ドメイン名にページに関するキーワードが含まれていた場合、英語の場合のようにポジティブに働くのでしょうか。

Punycodeでエンコードされたキーワードを含むURLでも、そのキーワードで検索することは可能ですのでご安心ください。また、ランキングやインデックスにおいて、日本語ドメインや日本語を含むURLは、英語のものと同様に扱われます。

※1 編集部注

Punycode(ピュニコード)とは、ドメイン名に英数字以外の文字を使えるようにした規格の「国際化ドメイン名」を英数字(ASCII)に変換する仕組み。Punycodeで変換すると、英数字以外の文字列を既存のDNSサーバーでも扱うことができる。

たとえば、「日本語.jp」をPunycodeで変換するとドメイン名は次のようになる。

  • 変換前:http://日本語.jp
  • 変換後:http://xn--wgv71a119e.jp

Web担の参考記事:ブラウザー競争と日本語ドメイン名/知って得するドメイン名のちょっといい話 #1

この記事が役に立ったらシェア!
tweet44このエントリーをはてなブックマークに追加
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める
日本赤十字社 東日本大震災 義援金募集
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める

今日の用語

勝手広告
企業広告を消費者や第三者が勝手に作って公開する自主制作の広告。 ... →用語集へ

連載/特集コーナーから探す

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

GOLD SPONSOR
さくらインターネット株式会社株式会社KDDI ウェブコミュニケーションズ株式会社日本レジストリサービスオープンテキスト株式会社トランスコスモス株式会社株式会社ハイパーボックスDomain Keeper
SPONSOR
株式会社キノトロープ株式会社アイレップ株式会社ニューズ・ツー・ユーシックス・アパート株式会社ウェブアンテナ株式会社サイバーエージェント富士通株式会社Sitecore