@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

2007-05-04から1日間の記事一覧

UTF-8

Lhaplus で Docx ファイルの拡張子を ZIP に変更して展開してみましたが、エラーがでちゃうんですね。展開そのものはできているようですけど.... でもって XML ファイルとか見てたんですが、Docx では文字コードが UTF-8 なんですね。 「あ」が \xE3\x81\x82…

Docxのコンバートツール

Docx 形式ファイルをほかの形式へと変換するツールもいくつかあるようですが、わざわざ変換してから検索するのは手間なのと、メタ情報などがどうなるか微妙ですかね。 DOCX Convert Office 2007 http://www.docx-converter.com/ Widgetは試してないんですけ…

Office 2007の形式ファイル

Word 2007のデフォルトでは Docx(Open XML)形式でデータを保存しますが、ファイル内容が圧縮されている*1ので、バイナリパターンで文字列検索を実施しても検索対象の文字列は圧縮されちゃってるのでひっかかりませんねとりあえず関連URLをメモ。 Microsoft …