アンタイ・フォレンジック伝道者の独り言

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

互換等価

特別編24 では、互換等価の例として「Ⅲ」U+2162 が出ているんですが、これを
NFKD または NFKC で正規化した場合、U+0049 な 「I」 の三文字「III」へと変換されるんですね。

U+2162
↓NFKD、NFKC
U+0049 U+0049 U+0049

これはこれで、バイト列が 3倍になるので検索する時にはちょっと注意が必要になるんでしょうかねぇ。