seclan のほえほえルーム

| |

UTF-16 への変換方法

・
2000/11/27 []

 UTF-16 への変換方法は次の通りです。ただし U を UCS または Unicode のコードポイントを表すことにします。また Bxx という表現は左にある U の xx ビット目の値をあらわしています。数字の中の _ は見やすくするために便宜上挿入した記号です。

変換方法

  1. 次の表を用いて、U をバイナリ表現に変換します。
    U の範囲 (16進) 変換された表現(バイナリ)
    0000_0000-0000_FFFF B15B14B13B12B11B10B09B08B07B06B05B04B03B02B01B00
    0001_0000-0010_FFFF 1 1 0 1 1 0 B19B18B17B16B15B14B13B12B11B10   1 1 0 1 1 1 B09B08B07B06B05B04B03B02B01B00

  2. バイナリを、変換値とします。16 bit 値をこのままの順に格納すると UTF-16BE となります。バイナリに示される 16bit 値のバイトをそれぞれ逆順にすると UTF-16LE となります。

変換例

  • 漢字 (0x226F 0x575B) → 226F575B


by seclan

関連


| |

 

配信

4.72 msec