@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

Breadの検索

全角平仮名「ぱん」、全角カタカナ「パン」半角片仮名「パン」を検索したい場合、Word のあいまい検索を使えばいずれもヒットしてくれます。
しかし、「は U+309A」や「ハ U+309A」は当然のことながら?曖昧検索でも一致しません。
正規化形式として NFC または NFKC を使うと、「は U+309A」は合成され「ぱ」に、「ハ U+309A」は「パ」になりますから、どちらも Word の曖昧検索でヒットするようになります。
とはいえ、フォレンジックフォレンシックの違いは Word の曖昧検索でも一致しないので駄目*1なんですが...

*1:NFDで正規分解してから正規表現で検索するってことになりますかね