Googleのコピーサイトへの対処法と公開日時に対する評価
Googleはページが公開された日時を記憶し、コピーページに対する評価判定をしていると言われていますが、先のUAL株価暴落の件で再度コピーサイトについて考えてみました。
過去にインデックスされた他サイトのページを完全コピーし、最新の日付に直しアップした場合、Googleではコピーページを上位表示してしまうのでしょうか。
Googleが考えるコピーサイトの対処法
コピーページに関するGoogleの見解が3カ月ほど前に公開されていたようですが、私自身完全にスルーしていたのか、チラ見して無意識に脳がスルーしたのかは分かりませんが、全く記憶に残っていなかったので、備忘録としてリンクを張っておきます。
Google、重複コンテンツ(コピペサイト)の対処方法について解説-SEM R
重複コンテンツ(Duplicate Content)とは
重複コンテンツとは、異なるページ(URL)に全く同一のコンテンツが掲載されていることを指す。ここでいう重複とは、グローバルナビやフッターなど、共通して設置される機能パーツを除く、ページのトピック(コンテンツ)にかかわる部分における重複の問題を指して取り上げられる話題だ。
MFAや不正コピーサイトは基本的に表示されない
検索結果に同一コンテンツを多数表示しないために、Googleはアルゴリズムによりオリジネーター(コンテンツの元の作成者・サイト)を識別し、そのサイトは非表示ではなく検索結果に表示されるように配慮している。これはウェブ上の公開日時だけでなくリンク構造など他の様々な要素を用いて総合的に判断を行っている。
Googleは総合的判断で元記事なのか、許諾を得た提携サイトなのか、悪意のあるコピーページなのかを判断し不正コピーサイトであればSERPsから除外すると言っています。
コピーサイト経由で元記事を見つける
しかし、上記のSEMRさんの記事はコピーページ経由で発見しました。
「Google 重複コンテンツ」や「Google コピーサイト」で検索した場合に、元記事であるSEM-Rのページではなく、はてなダイアリーの記事が上位表示されます。

はてなダイアリーのページは、コピー部分がblockquoteタグで囲まれており青枠がついているので、目視ではどこからか転載しているのか?という事が分かるのですが、SEMRへのリンクがないために、Googleは元記事よりもはてなの記事を高評価してしまっているように思えます。
SEMRの記事は、上記のキーワードでは100位以内にも見当たらず、Googleは元記事をコピーページと判断してしまっているようです。
htmlソース上、blockquoteタグで引用を明示しているにも関わらず、元記事を非表示にしてしまっているようでは、引用であることを明示していない完全に悪意のあるコピーページを、元記事よりも高評価する事は多いにあるでしょう。
Googleは「オリジネーター(コンテンツの元の作成者・サイト)の識別を総合的に判断している」と言っていますが、実は単純に元記事サイトへのリンクの有無で、コピーか否かを判断しているのかもしれません。
Googleにはもう少し、先に公開(インデックス)された記事に対する評価を検索順位に加味して欲しいと思う今日この頃です。
ただ、引用・転載する場合、元記事へのリンクを張るのが常識ですね。って相互リンクの件と同様に、モラルを求めてもしょうがいないですが。
ちなみに、タイトル全文である「Google、重複コンテンツ(コピペサイト)の対処方法について解説」で検索するとSEMRのページが上位表示されますが、こんなキーワードで検索するユーザーはいません。

コピーサイトに負けないオーソリティサイト
重複コンテンツを「スパムではないが、検索結果から非表示にする」と言っているGoogleですが、リンクも張らずにコピーしているページが検索結果に表示されてしまっているのが現状です。
今書いているこの記事がインデックスされた後に、オーソリティサイトがタイトル・meta・見出しを含め全く同じ記事内容でアップした場合(元記事へのリンクなし)に順位がどうなるのかが気になります。
渡辺さんも記事の中で書いているように、インデックスの順番よりサイト評価の方が優先されてしまうのでしょう・・・
ということで何が言いたいかというと、今後も公開日時よりもリンクの有無やサイト評価が優先されるだろうから、インデックスの遅いサイトの記事をパクリしましょう・・・・・ということではなく、「自サイトをオーソリティサイトに育てましょう」ということです。
でもなぜ、GoogleはオーソリティサイトであるSEMRよりもはてなダイアリーを優先しているのでしょうか?
重複コンテンツはスパムにはならない事をGoogleが再説明
異なるURLにおいて同一コンテンツが掲載される場合、許諾・提携を明示した重複コンテンツであれば全てのページが問題なくインデックスされます。

同一サイト内における重複コンテンツについては、悪意のあるコピーページ同様SERPsから非表示にすると言っているGoogleですが、これに対する質問が多いらしく、再度解説をしたようです。
重複コンテンツはペナルティにはならない~グーグルが再説明-海外SEO情報ブログ
Googleは、重複コンテンツを発見した場合、通常1つを残して他のページ(URL)を検索結果から非表示にします。しかし、これはペナルティではありません。
多くのウェブマスターが、重複コンテンツは検索エンジンからペナルティを受けると誤解しています。
グーグルが間違った処理をしなければ、質問も減ると思うんですけどね。
タグ:はてな コピーサイト ペナルティ 重複コンテンツ Google


CoolWebです。
参考になりました。
コピーします。
ナンチャッて。
コメント by coolweb 2008/9/16 0:32:22
>coolwebさん
オーソリティサイトであればコピーしてもOKです。
コメント by パシフィカス 2008/9/16 0:41:38