文字コードはSEOに影響するのかUTF-8、EUC-JP、Shift_JIS

文字コーとドはコンピュータ上で文字を利用するために、各文字に割り当てられるバイト表現もしくは、バイト表現と文字の対応関係のこと。出典: フリー百科事典『ウィキペディア(Wikipedia)』

日本語サイトの文字コード

日本語サイトで一般的に使われている文字コードは3種類です。

UTF-8

  • Unicodeで定義される文字集合を用いて記述された文字列。
  • UTF-8では1文字を1〜6バイトの可変長の数値に変換するようになっている。
  • 日本語などの文字では元々2バイトのものが、3バイトや4バイトで表現される。

EUC-JP

  • 元々はUNIXで日本語文字を扱うためのコード体系で、複数バイトの文字を扱う文字コードの枠組み。
  • 日本語UNIXシステム諮問委員会の提案に基づいて1985年にAT&T社が定めた。

Shift_JIS

  • 現在多くのパソコン上で日本語を表すために使われている文字コード。
  • 文字化けやエスケープ文字などの問題がある。

SEOにとってどの文字コードがベストなのか

キーワード「SEO」で上位20位の文字コードを調べてみます。(リンク切れは除外)

【Google】
UTF-8…10
EUC-JP…3
Shift_JIS…6

【Yahoo!】
UTF-8…7
EUC-JP…4
Shift_JIS…7

UTF-8に移行するサイトが多いが・・  

上記の「SEO」上位20位で調べた結果はUTF-8に軍配が上がりましたが、日本語サイト全体で調べてみるとShift_JISが圧倒的に多いことが分かります。

数年ほど前からUTF-8がウェブサイトの標準文字コードになると言われていましたが、日本語のようなマルチバイト文字はデータサイズ面で不利になってしまう関係で、それほど普及してはいないようです。

現時点ではどの文字コードが有利、不利ということはありませんが、SEO関連サイトにUTF-8が多いことは気になるところです。

Yahoo!JAPANも1月に行われたホームページリニューアルにともない、EUC-JPからUTF-8に変更されています。

やっぱりこれから作るのはUTF-8が良いのかなぁ。

タグ


公開日:2008年3月8日
最終更新日:2011年7月24日

コメントは受け付けていません。 |

コメント&トラックバック

トラックバック

コメントは受け付けていません。

SEO対策のSEOウェブネット
◆◆◆◆◆◆◆◆
コンサルティング型のSEOサービスの提供。インターネットに関する用語集や、初心者が抱きがちな疑問に対して回答。
無料SEO対策のススメ
◆◆◆◆◆◆◆◇
自分でYahoo、Google対策をする人の為の上位表示テクニックや良くある質問の紹介。無料で使えるツール集
SEOテンプレート比較
◆◆◆◆◆◆◇◇
販売されているホームページテンプレートの比較とブログでアクセスアップ法などを解説。WordPressの使い方WP SEOブログ無料SEO対策
格安レンタルサーバー比較
◆◆◆◆◆◇◇◇
サーバーごとのWordPressのインストール方法などを解説。レンタルサーバーのQ&Aレンタルサーバーの用語集レンタルサーバーブログ
アフィリエイトで稼ぐ為の情報ブログ
◆◆◆◆◇◇◇◇
初心者がゼロからアフィリエイトを学ぶための方法や効果的なサイトの作り方などを解説するサイトです。アフィリエイトのやり方AdSenseの使い方