@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

正規表現による検索

コンピュータ・フォレンジック製品によっては、検索で正規表現を使えたりするわけですが、確かに便利なのですが長い定義になると何かひっかからないのかよくわからなくなってしまう自分がいたり(^^;;
正規表現を使うことで広範囲に検索できるのは嬉しいのですが、逆にヒットしすぎてしまう面もあったり、複雑な検索文は実行に時間がかかったりもします。
例えば、あるトレーニングでは正規表現を使った検索文を作成させる問題が出たりするのですが、真面目に回答して作成した検索文を実行すると1時間以上かかってしまい、次の問題へ進めなかったりします。
検索終了までの予想時間が出た段階で、「こりゃ間に合わない」と思ったのでキャンセルして正規表現でないパターン(べたに検索したい文字列だけを登録)で検索しちゃいました。練習なので気軽にキャンセルしちゃいましたが、正規表現のパターンで調べないとヒットしない文字列があると、見落としが出ることになってしまいますかね。*1
ASCII だけならまだしも、これに日本語文字列ってのが入ってくると...orz

*1:その見落としが許されないとなると、数時間〜数十時間をかけて検索が終わるのを待つ必要があるわけですが、それでも何もヒットしないかもしれないわけですやね