2008/3/8
Filed under: WEB, 1- テクニック — パシフィカス @ 3:33:36

文字コードはSEOに影響するのかUTF-8、EUC-JP、Shift_JIS

文字コーとドはコンピュータ上で文字を利用するために、各文字に割り当てられるバイト表現もしくは、バイト表現と文字の対応関係のこと。出典: フリー百科事典『ウィキペディア(Wikipedia)』

日本語サイトの文字コード

日本語サイトで一般的に使われている文字コードは3種類です。

UTF-8

  • Unicodeで定義される文字集合を用いて記述された文字列。
  • UTF-8では1文字を1~6バイトの可変長の数値に変換するようになっている。
  • 日本語などの文字では元々2バイトのものが、3バイトや4バイトで表現される。

EUC-JP

  • 元々はUNIXで日本語文字を扱うためのコード体系で、複数バイトの文字を扱う文字コードの枠組み。
  • 日本語UNIXシステム諮問委員会の提案に基づいて1985年にAT&T社が定めた。

Shift_JIS

  • 現在多くのパソコン上で日本語を表すために使われている文字コード。
  • 文字化けやエスケープ文字などの問題がある。

SEOにとってどの文字コードがベストなのか

キーワード「SEO」で上位20位の文字コードを調べてみます。(リンク切れは除外)

【Google】
UTF-8…10
EUC-JP…3
Shift_JIS…6

【Yahoo!】
UTF-8…7
EUC-JP…4
Shift_JIS…7

UTF-8に移行するサイトが多いが・・  

上記の「SEO」上位20位で調べた結果はUTF-8に軍配が上がりましたが、日本語サイト全体で調べてみるとShift_JISが圧倒的に多いことが分かります。

数年ほど前からUTF-8がウェブサイトの標準文字コードになると言われていましたが、日本語のようなマルチバイト文字はデータサイズ面で不利になってしまう関係で、それほど普及してはいないようです。

現時点ではどの文字コードが有利、不利ということはありませんが、SEO関連サイトにUTF-8が多いことは気になるところです。

Yahoo!JAPANも1月に行われたホームページリニューアルにともない、EUC-JPからUTF-8に変更されています。

やっぱりこれから作るのはUTF-8が良いのかなぁ。タグ:

コメント RSS

コメントをどうぞ

Copyright (C) 2008 WEBNET Corporation All Rights Reserved.SEOwebNET