2009/1/19
カテゴリ: SEO, 2- Yahoo, 1- テクニック, 検索エンジン — パシフィカス @ 6:03:29

ヤフーのキャッシュ日付とクロール日表示 その1

表示されました

ヤフーの検索結果ページ(以下SERPs)のキャッシュの横に表示される日付をページがキャッシュされた日付だと勘違いしていたのですが、これはページ最終更新日という認識が正しいのでしょうか?

そんなの常識だろという声が聞こえてきそうですが、知らなかったものは知らなかったという事で、これを機に長期記憶に取り入れます。

でもなぜヤフーのサイト上に「クローラーが巡回した日である」と明示しているにも関わらず更新日を表示しているのでしょうか?

まずはSERPsにキャッシュ日付を表示しよう

Yahoo!JAPANのIDでログインしていない状態や、ログインしていてもデフォルトでは日付が表示されないので、設定を変更します。

ログイン > SERPs上部の設定 > クロール日表示
日付を表示

ページによってはONにしても表示されていないケースがありますがこれは後述。

日付=クローラーの巡回日?

クロール日表示の説明として、 『ウェブ検索のクローラーがページを巡回した日を表示する。』とありますが、表示されている日付とクロール日は明らかに異なっています。

例えばSERPsに表示されるメインサイトのキャッシュ日付は1/17現在、1/5となっています。

クロール日付

Yahoo!クローラーの実際のクロール日

生ログを見たところ、1/5以降にもというか毎日Yahooのクローラーは当サイトに訪れています。
Yahoo! Slurp(72.30.79.28、72.30.87.96、72.30.142.88など)

キャッシュ日付けに表示された1/5というのはindex.htmlの最終更新日でした。

Yahooクローラー情報

クローラーのIPアドレスは晴練雨読さんの「到着クローラー分析」が参考になります。 アクセス解析によっては検索エンジンのクローラーをカウントしない(できない)ため訪問を確認することができません。

Google Analyticsは元々IPなどの情報は無し、Research Artisan(リサーチアルチザン)はYahooクローラーは検出されないようです。(Yahooモバイル用クローラー 124.83.159.・・・ は検出されます。)

今回の件とは関係ありませんが、クローラーのアクセスもPVに入れてしまっているアメーバブログのアクセス数が少し話題になっているようです。

キャッシュ日付の正体と閉鎖されたブログの日付

SERPsのキャッシュ日付に関してググって見ると、少し古いですが下記ページがHITしました。

Yahoo!検索における「 キャッシュ日付 」 の正体 ‐ SEOの種

Yahoo!の検索結果ページに表示されている「 日付 」 は、よく勘違いされるところではありますがページの「 キャッシュ日付 」 ではありません。

Yahoo!の検索結果ページに表示されている「 日付 」 は、「 Yahoo!検索がキャッシュした日付 」つまり、「 Yahoo!クローラーがページにアクセスし、保存した日付 」 である。 ・・・という勘違いは、Yahoo!検索結果の表示を、Googleのものと、同一視した結果、生じたものと思われます。

しかし、更新がストップされたブログなどのキッシュ日付が、更新日時の数カ月後というケースも多くあり疑問が残ります。

ただ、特に外部ブログの場合にはサイドバーなどのテンプレート部分の変更や、ブロガーの直接的な更新とは別にブログパーツやアフィリエイトがあるために、実際の最終更新日とYahooが把握する最終更新日が異なるという事も考えられます。

そこで、まずは管理サイトの中で”ブログを含まない通常のhtmlサイト”において、最終更新日時が把握できるページとSERPsのキャッシュ日付を確認した所、全てのサイトにおいて100%一致する結果となりました。

検索キーワードによりキャッシュ日付が多少古くなる事はありますが、ページURLで検索した場合には最終更新日と同日となっており、実際の更新日を大幅に”超えた”キャッシュ日付はありませんでした。(0時付近の更新の場合は1日ずれるケース有り)

これだけでは『キャッシュ日付=更新日時』とは言いきれないので、今後のためにも検証しておきたいと思いましたが、長くなったのでヤフーのキャッシュ日付とクロール日表示 その2へ。

コメント RSS

現在コメントフォームは利用できません。

(C) 2010 パシのSEOブログ. All Rights Reserved. | 運営サイト | SEO対策実施サイト