アンタイ・フォレンジック妖怪の独り言

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

インデックス処理

文字化けとかとは違いますが、インデックスを作成するケースでは、全角と半角混じりのパターンがどう処理されるか確認しておいた方がよいかもしれません。
例えば「Forensics」のように前半は全角英数で後半部分が半角英数のようなパターンとか、全角英数と半角英数が混在しているようなケースがありますね。これを例えば半角英数の Forensics で検索できるかどうかって辺りでしょうか。まぁインデックス処理を行うエンジンの仕様によるのかもしれませんが・・・