アンタイ・フォレンジック妖怪の独り言

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

みたい心理?

アンチ・フォレンジックなお話がちらほら出ている今日この頃ですが、文字コード方面だと以下のご指摘がありますね。

見えない文字 http://d.hatena.ne.jp/hasegawayosuke/20041121#p3 より引用ここから、

また、見えない文字という特質を生かすと、ログファイルを一瞥する限りは不審なユーザによる
侵入の痕跡はないのに、実は "gue" U+FEFF "st" という、guest とは異なるアカウントを作成
されていた、というようなシナリオも考えられます。これは、皮肉なことにログのビューアが
Unicodeに対応すればするほど発見しにくくなります(Unicode非対応であれば、U+FEFFは文字化
けした何らかの形で見えることが期待できる)。

引用ここまで

上記の例では、guest という文字列に BOM(U+FEFF)を挟むことで、見た目 guest になるけどバイト列としては違うケースが紹介されています。
以前の“アマゾソ*1”と同じく、guest という文字列を検索した場合、検索ツールによっては gueU+FEFFst が一致せずに見落とし(検知できない)が発生する危険性があると。
BOM(U+FEFF)って、見えたほうが嬉しいんですかねぇ。見えなくてもいいけど、検索とかでは BOM をうまく処理して欲しいとかになるのかなぁ。