2000/11/29 [水]
UTF-32 への変換方法は次の通りです。ただし U を UCS または Unicode のコードポイントを表すことにします。また Bxx という表現は左にある U の xx ビット目の値をあらわしています。数字の中の _ は見やすくするために便宜上挿入した記号です。
変換方法
- 次のように、U をバイナリ表現に変換します。
U の範囲 (16進) 変換された表現(バイナリ) 0000_0000-0010_FFFF 00000000 0 0 0 B20B19B18B17B16 B15B14B13B12B11B10B09B08 B07B06B05B04B03B02B01B00
- バイナリを、変換値とします。このままの順だと UTF-32BE となります。バイナリに示されるバイトの順を逆にすると UTF-32LE となります。
変換例
-
漢字 (0x226F 0x575B) → 0000226F0000575B
by seclan