XMLサイトマップ、RSS/Atomを使い Googleに正しくサイト内ページと更新情報を知ってもらう

Googleや他の検索エンジンによるクロールを最適化するためにXMLサイトマップRSS/Atomフィードの両方を利用しよう。というお話

XMLサイトマップ

サイトマップインデックスを利用している場合は、複数XMLサイトマップがあったとしてもGoogleへのpingは1回のみでOK。 複数XMLサイトマップに少しだけURLを記載するのは間違いで、想定された時間ないでXMLサイトマップをすべてダウンロードされなくなる可能性がある。 => URLが少ないとき(5万URLor無圧縮10MB以下)は1つのXMLサイトマップにまとめろって事だと思う。

RSS/Atom

  • サイト内の更新情報を伝えるためのもの、頻繁に更新されるべき
  • 一般的にファイルサイズが小さい
  • PubSubHubbub を利用する (wordpressプラグインにある)

新たなページの追加、既存のページが実質的に更新されたとき、フィードにそのURLと更新日時を追加する Googleによる更新情報見逃し防止のため、RSS/Atomフィードには少なくとも前回のGoogleのクロール以降のすべての更新情報を含める。

=> PubSubHubbub を利用するのがオススメ

参考