seclan のほえほえルーム

| |

JIS X 0213 と SJIS の関係

・
2000/11/04 []

 DOS や Windows では、漢字は Shift JIS で扱っています。この Shift JIS という方式は、JIS コードを文字どおり Shift として扱う方式です。つまり JIS コードの 0x2121-0x7e7e の範囲のコードを次の表の1面と書いてある領域にそのまま順番に対応づけて表現します。

SJIS 表現可能範囲
第一バイト第二バイト文字数備考
81h-9Fh40h-7Eh,80h-FCh5828JIS X 0213 1面
E0h-EFh40h-7Eh,80h-FCh3008
F0h-FCh40h-7Eh,80h-FCh2444JIS X 0213 2面

 今回の JIS X 0213 では、面が 2 つ定義されました。1面は今までの JIS X 0208 と同じ領域、そして 2面が新しく漢字用に新設された領域です。この 2面は従来拡張領域とされてきた第一バイト F0h-FCh の領域にマップします。しかし一つ問題があります。2面は EUC との兼ね合いから 1, 3〜5, 8, 12〜15, 78〜94区という非連続な領域が使用されているので、このままではうまく対応づけできません。そこで、2面は下の表にある対応で変換することになりました。この結果、JIS X 0213 を SJIS で表現したときには、文字コードの順番が保存されなくなることがあります。

2面の対応表
第二\第一
バイト
F0hF1hF2hF3hF4hF5hF6hF7hF8hF9hFAhFBhFCh
40h〜9Eh13513157981838587899193
9Fh〜FCh841214788082848688909294



by seclan | コメント (0) | トラックバック (0)

関連

コメント

 コメントできる期間はすでに過ぎています。


トラックバック

 トラックバックできる期間はすでに過ぎています。


| |

 

配信

16.42 msec