文字コードはSEOに影響するのかUTF-8、EUC-JP、Shift_JIS
文字コーとドはコンピュータ上で文字を利用するために、各文字に割り当てられるバイト表現もしくは、バイト表現と文字の対応関係のこと。出典: フリー百科事典『ウィキペディア(Wikipedia)』
日本語サイトの文字コード
日本語サイトで一般的に使われている文字コードは3種類です。
UTF-8
- Unicodeで定義される文字集合を用いて記述された文字列。
- UTF-8では1文字を1~6バイトの可変長の数値に変換するようになっている。
- 日本語などの文字では元々2バイトのものが、3バイトや4バイトで表現される。
EUC-JP
- 元々はUNIXで日本語文字を扱うためのコード体系で、複数バイトの文字を扱う文字コードの枠組み。
- 日本語UNIXシステム諮問委員会の提案に基づいて1985年にAT&T社が定めた。
Shift_JIS
- 現在多くのパソコン上で日本語を表すために使われている文字コード。
- 文字化けやエスケープ文字などの問題がある。
SEOにとってどの文字コードがベストなのか
キーワード「SEO」で上位20位の文字コードを調べてみます。(リンク切れは除外)
【Google】
UTF-8…10
EUC-JP…3
Shift_JIS…6
【Yahoo!】
UTF-8…7
EUC-JP…4
Shift_JIS…7
UTF-8に移行するサイトが多いが・・
上記の「SEO」上位20位で調べた結果はUTF-8に軍配が上がりましたが、日本語サイト全体で調べてみるとShift_JISが圧倒的に多いことが分かります。
数年ほど前からUTF-8がウェブサイトの標準文字コードになると言われていましたが、日本語のようなマルチバイト文字はデータサイズ面で不利になってしまう関係で、それほど普及してはいないようです。
現時点ではどの文字コードが有利、不利ということはありませんが、SEO関連サイトにUTF-8が多いことは気になるところです。
Yahoo!JAPANも1月に行われたホームページリニューアルにともない、EUC-JPからUTF-8に変更されています。
やっぱりこれから作るのはUTF-8が良いのかなぁ。タグ:Webテクニック
- ホームページ制作ソフト「Dreamweaver CS3」8からのアップグレード後のレイアウト崩れ
- ブラウザシェアとCSSデザイン。IE6と7の共存、Firefox2と3の併用。
- 外部リンクは別窓(target="_blank")が常識?
- CSSで画像の簡易ロールオーバーを行う方法
- Firefox利用者急増中|ブラウザによる見え方の違い
トラックバック URI : http://www.jweb-seo.com/blog/wordpress/2008/03/08/148/trackback/