Autopsy 4.4.0 におけるキーワード検索(Stem)
Autopsy のキーワード検索で、Stem を利用した検索が可能かを確認。
サンプルデータは Content-Encoding: windows-1252 として認識されているテキスト ファイル。また、サンプル文字列として、solr.PorterStemFilterFactory で例示されている文字列パターンとして "riding", "rides", "horses" を末尾に追記。
上記の「インデックス化されたテキスト」に対して、例示されている"ride", "hors" を完全一致で検索しても、"riding", "rides", "horses" の文字列にはヒットしない。
Autopsy 4.4.0 のキーワード検索は stem による検索を利用できないので、サブストリング一致で検索を行う必要がある。(サブストリング一致で ride を検索しても、riding に一致するわけではないですが)
スキーマファイルを調整する事で可能になるかもしれないが未確認。
stemを意識して検索する必要があるキーワードのパターンとしては、他にどのような文字列がありますか?