2000/12/01 [金]
RACE とは、Row-based ACE の略語で、DNS への使用を想定した Unicode の Encoding 方式です。今実験されている、いわゆる'日本語ドメイン'には、この変換方式が主に使用されています。ちなみに、ACE とは、ASCII Compatible Encoding の略語で、非 ASCII 文字を ASCII 文字互換にする方式のことを言います。
この方式の特徴は、UTF-16 表現の変換対象文字列の各文字の上位バイトが全て同一の値であるか、0 または他の単一の値である場合に限って、文字列を圧縮して変換できるというところにあります。したがって、変換後の文字長が同じである場合、単純な変換を行う UTF-5 よりも、RACE の方がより長いドメイン名を使用できる可能性があります。そのような理由から、RACE が主な実験対象に選ばれたようです。
以前掲げた表に、RACE を加えたものを再掲します。
この方式の特徴は、UTF-16 表現の変換対象文字列の各文字の上位バイトが全て同一の値であるか、0 または他の単一の値である場合に限って、文字列を圧縮して変換できるというところにあります。したがって、変換後の文字長が同じである場合、単純な変換を行う UTF-5 よりも、RACE の方がより長いドメイン名を使用できる可能性があります。そのような理由から、RACE が主な実験対象に選ばれたようです。
以前掲げた表に、RACE を加えたものを再掲します。
UTF | 表現可能最大値 | バイト長(*) | 別名 | コメント | 出典 |
---|---|---|---|---|---|
UTF-1 | 0x7FFFFFFF | 1-5 | - | 破棄された | ISO 10646:1993 Annex G |
UTF-2 | 0x7FFFFFFF | 1-6 | UTF-8 | UTF-8 の昔の名前 | - |
UTF-5 | 0x7FFFFFFF | 1-8 | - | DNS への使用を想定 | draft-jseng-utf5-00.txt |
UTF-7 | 0x0010FFFF | 1-6 | - | Mail での使用を想定 | RFC2152 |
UTF-8 | 0x7FFFFFFF | 1-6 | FSS-UTF | ファイルシステムでの使用を想定 | RFC2279 |
UTF-16 | 0x0010FFFF | 2,4 | - | - | RFC2781 |
UTF-32 | 0x0010FFFF | 4 | - | - | Unicode TR19 |
RACE | 0x0010FFFF | 1-8 | - | DNS への使用を想定 | draft-ietf-idn-race-02.txt |
(*)1バイト==8bit。また識別用ヘッダを除いた長さ。 |
by seclan