@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

2007-05-01から1ヶ月間の記事一覧

UTF-8

Lhaplus で Docx ファイルの拡張子を ZIP に変更して展開してみましたが、エラーがでちゃうんですね。展開そのものはできているようですけど.... でもって XML ファイルとか見てたんですが、Docx では文字コードが UTF-8 なんですね。 「あ」が \xE3\x81\x82…

Docxのコンバートツール

Docx 形式ファイルをほかの形式へと変換するツールもいくつかあるようですが、わざわざ変換してから検索するのは手間なのと、メタ情報などがどうなるか微妙ですかね。 DOCX Convert Office 2007 http://www.docx-converter.com/ Widgetは試してないんですけ…

Office 2007の形式ファイル

Word 2007のデフォルトでは Docx(Open XML)形式でデータを保存しますが、ファイル内容が圧縮されている*1ので、バイナリパターンで文字列検索を実施しても検索対象の文字列は圧縮されちゃってるのでひっかかりませんねとりあえず関連URLをメモ。 Microsoft …

Word+Acrobat

WORD 2003で「あいう」を入力し、PDF で出力後、Acrobat 7.0.9 でファイルを開いて RTF 形式で保存した場合のパターンは「{\uc2\u12354 \'82\'A0}{\uc2\u12356 \'82\'A2}{\uc2\u12358 \'82\'A4}」 これを EnCase の GREP 検索で検索する場合は「\\u12354.*\\…

WORDのパターン色々

WORD 2003 で「アイウ」を入力し RTF で保存した場合のパターンは「\'83\'41\'83\'43\'83\'45」 WORD 2003 に文字コード表から「アイウ」をフォント MS P ゴシックでコピーして張り付けて RTF で保存した場合のパターンは「\'83\'41\'83\'43\'83\'45」 WORD …

読み取りと保存

読み取る際は、\'83\'41 でも \'83A でも OK みたいですが、WordPad で保存すると \'83A は \'83\'41 へ変換して保存、WORD では \'83A のまま保存されるようですね。PowerPoint では \'83\'41 を保存すると、\'83A へ変換して保存。

パワーポイントのRTF出力

さっそく前言撤回しないといけないみたいで、PowerPoint 2003で「ア」をアウトライン/リッチ テキスト形式(*.rtf)で保存し確認したところ、「\'83A」で保存されました。

全角「ア」のパターン

RTF形式で、全角「ア」を RTF 形式で保存した場合に、エスケープ処理がどのようにされているかを調べてみました。 手順的には、対象アプリケーションを起動し、「ア」を入力して RTF 形式で保存し、メモ帳で中を開いて確認していますが、「\'83A」でエスケー…