@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

2009-02-09から1日間の記事一覧

インデックス処理

文字化けとかとは違いますが、インデックスを作成するケースでは、全角と半角混じりのパターンがどう処理されるか確認しておいた方がよいかもしれません。 例えば「Forensics」のように前半は全角英数で後半部分が半角英数のようなパターンとか、全角英…

RTFファイル

添付ファイルとして、リッチテキストファイル(RTF)を試すケースでは、複数種類のツールを使って RTF を生成するほうがよいですかね。Notepad、ワードパッド、Word、OpenOffice とか。

HTMLメールとリッチテキスト形式

「修正箇所とコメントは赤字にしてあります」と言われても、手元のメーラでは黒字しかなくて悲しい思いをして以来、Outlookを使うようになりましたが・・・

だめ文字が含まれるケース

Shift_JISの2バイト目に区切り文字列と同一パターンが含まれているケース。 「能力」を Shift_JIS(CP 932)の 16進数パターンで表現すると「\x94\x5C\x97\xCD」となる、円マーク記号(\) \x5c が含まれる文字列が Subject や添付ファイル名に含まれるケース…

JIS2004 サロゲートペア文字

なかなかお目にかかることがない気がしないでもないですが、Unicode サロゲートペア文字を含むケースもテストしておいた方がいいですかね。文字列の検索時にサロゲートペアが考えられてないか、サポートされておらずヒットしないケースとかありますね。

機種依存文字

使わないのがマナーというのはすでに過去のお話なのかもしれませんが、よく見かける丸付き数字の?とか、?などの文字列。化けるというよりは違う字形で表示されるというだけかもですが。 参照:利用者:Suisui/機種依存文字テスト

添付ファイルのエンコード方式

Base64 と UUENCODE 辺りですかね。どちらかというと、添付ファイル名に、だめ文字が含まれるとか機種依存文字があるケースで添付ファイル名の表示に問題が発生するケースとかがありますかね。

メール本文のエンコード方式

Windows のコードページでいくと、50221(半角カナを含むJIS)、65000(UTF-7)、65001(UTF-8) りをテストしておけば最近はOKなんでしょうかね。念のため 932 とか 51932 なケースもやっておくと安心かもしれません。 主には 50220 でOKな気がしていたので…

Subjectがとても長いケース

電子メールの題名(Subject)がとても長いケースだと、MIMEエンコードした場合に複数行に分かれることになります。このときツールが複数行に対応していない?と、電子メールの Subject が途中で切られて表示される現象にでくわすことがあります。 Openmya MLと…

文字化けを引き起こすテスト

コンピュータのフォレンジック調査で使うツールは基本的に海外製品ばかりですので、日本語文字列の取り扱いが時々アレだったりします。最近は Unicode でなんとかなるようになりつつありますが、製品のQA部隊から「何をテストしておけばいいのか?」とか急に…