@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

EnCaseでの Unicode 文字列検索

念のため書いておきますが、EnCase であれば以下の test.txt から UTF-16LE(41 00 53 00 43 00 49 00 49 00)、UTF-16BE(00 41 00 53 00 43 00 49 00 49) いずれの文字列「ASCII」も(同時に)検索させることが可能です。

$ od -t x1 -A x test.txt
000000 41 53 43 49 49 ff fe 41 00 53 00 43 00 49 00 49
000010 00 fe ff 00 41 00 53 00 43 00 49 00 49

この test.txt では文字列の前に BOM をつけていますが、無くても検索できます。
で、問題は「正規化」というお話になるわけですかね。