@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

2005-11-07から1日間の記事一覧

スライド27

Shift_JIS な文字列検索を例にしたお話ですが、EFE 5.04a では 2byte で 1文字という扱いになっていないので、キーワードとして登録する文字列と、正規表現の使い方によってバイト列が一致しなくなる場合がありますよってお話です。 正規表現を使わなければ…

スライド22

サロゲートペアの検索ですが、ここで書いたように、EFE 5.04a では UTF-8 でのサロゲートペア文字の検索はダメっぽいので注意が必要です。

スライド13

Unicode 制御文字ですが、ここの部分は積み残している課題がいろいろあったりします。まず意図的に(検索やフィルタを逃れる目的で)制御文字を使われていることを簡単に検知する方法が個人的には思いつかないので手付かず状態ですね。 スライド 15 に書いて…

スライド11,12

ISO-2022 系のエスケープシーケンスを検索することで、スラックスペースや未割当て領域やメモリダンプに含まれる ISO-2022 な文字列を効率よく見ていけるのでは?というお話で、日本語に関連したエスケープシーケンスの一覧になっています。 個別にキーワー…

スライド8

現時点で、異なる文字コード毎に日本語文字列を抽出し検索を行うのであれば、やはり istrings、jstrings の出番かと思います。せきゅ蕎麦で id:sonodam さんと雑談しているなかでも、いろいろなローテクやアンチな手法を調査する際にも、istrings 的なアプロ…