文字コードについて ISO-2022-JP, Shift_JIS, EUC-JP, UTF-8

/ HTML5/CSS3/jQuery / Comment[0]

Webでよく使われる文字コードをまとめてみました。

ISO-2022-JP

電子メールでよく見る日本の文字用の文字符号化方式。
日本語表記への利用が想定されている文字コード。漢字、ひらがな、カタカナ、ラテン、ギリシャ、キリル文字なども含んでおり、学術や産業分野での利用を考慮した方式。

Shift_JIS

主にファイル名などで日本語をあらわすために使われている文字コード。
MicrosoftやMacOSが実装する亜種として、Microsoft CP932, MacJapaneseがある。
全角文字とJIS X 0201で定義したカナ文字を同一のコード体系で表現できることと、MSDOSで日本語用文字コードとして採用されて以来、圧倒的な普及度がある。

EUC-JP

UNIX上で日本語文字を扱う場合にもっとも多く利用されている文字コードの一つ。
UNIX以外でも使われ、JP以外にもEUC-KR,EUC-CNなどがある。

UTF-8

UCSとUnicodeで使える8ビット符号単位の文字符号化形式および文字符号化スキーム。

関連記事

コメント

:
:
:
:
:
管理人のみ表示を許可