XMLサイトマップ、RSS/Atomを使い Googleに正しくサイト内ページと更新情報を知ってもらう
Googleや他の検索エンジンによるクロールを最適化するためにXMLサイトマップとRSS/Atomフィードの両方を利用しよう。というお話
XMLサイトマップ
- サイト内のすべてのURLを伝えるためのもの
- ファイルサイズが大きい
- 単独XMLサイトマップの場合、1日1回Googleにping
- 単独のXMLサイトマップの場合:更新は少なくとも1日1回行いGoogleにpingする(定期的に更新しているサイトの場合)。
- 複数のXMLサイトマップの場合:それぞれのサイトマップは5万URL、もしくは圧縮されていない状態で10MBまでにする。更新するとGoogleにpingする。
サイトマップインデックスを利用している場合は、複数のXMLサイトマップがあったとしてもGoogleへのpingは1回のみでOK。 複数のXMLサイトマップに少しだけURLを記載するのは間違いで、想定された時間ないでXMLサイトマップをすべてダウンロードされなくなる可能性がある。 => URLが少ないとき(5万URLor無圧縮10MB以下)は1つのXMLサイトマップにまとめろって事だと思う。
RSS/Atom
- サイト内の更新情報を伝えるためのもの、頻繁に更新されるべき
- 一般的にファイルサイズが小さい
- PubSubHubbub を利用する (wordpressのプラグインにある)
新たなページの追加、既存のページが実質的に更新されたとき、フィードにそのURLと更新日時を追加する Googleによる更新情報見逃し防止のため、RSS/Atomフィードには少なくとも前回のGoogleのクロール以降のすべての更新情報を含める。
=> PubSubHubbub を利用するのがオススメ