@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

Autopsy 4.4.0 におけるキーワード検索(Stem)

Autopsy のキーワード検索で、Stem を利用した検索が可能かを確認。

サンプルデータは Content-Encoding: windows-1252 として認識されているテキスト ファイル。また、サンプル文字列として、solr.PorterStemFilterFactory で例示されている文字列パターンとして "riding", "rides", "horses" を末尾に追記。

f:id:hideakii:20170814201750p:plain

上記の「インデックス化されたテキスト」に対して、例示されている"ride", "hors" を完全一致で検索しても、"riding", "rides", "horses" の文字列にはヒットしない。

Autopsy 4.4.0 のキーワード検索は stem による検索を利用できないので、サブストリング一致で検索を行う必要がある。(サブストリング一致で ride を検索しても、riding に一致するわけではないですが)

 スキーマファイルを調整する事で可能になるかもしれないが未確認。

 stemを意識して検索する必要があるキーワードのパターンとしては、他にどのような文字列がありますか?