Office 2003 の Word に、BMP や GIF、JPEG などの画像データを貼り付けた場合、画像の形式によっては PNG に変換されてデータが保存されているんですね。文書ファイルからデータをパターンで抽出する方法についてご質問をいただいて、少し確認してみたのですが、てっきりそのままバイナリデータが DOC ファイル中にあるのかと思ったら違ってました(^^;;
気になったので少し調べてみたところ、以下の情報があったのでメモ。
Wordの.DOCファイルから高解像度の画像データを取り出す
http://www.atmarkit.co.jp/fwin2k/win2ktips/945hipic/hipic.htmlWord内に挿入した元の画像を取り出したい
http://tacomakix.blog.so-net.ne.jp/2005-06-28Word 2007の.DOCXファイルから高解像度の画像データを取り出す
http://www.atmarkit.co.jp/fwin2k/win2ktips/948hipic2007/hipic2007.html
DOC ファイルであれば、JPEG と PNG のパターンで検索すれば文書ファイル中から画像を抽出して確認できそうですね。詳しく確認できてませんが、元画像ファイルの名前とかも確認できるのかは不明ですが、ちらっと見た時に張り付けたファイルの名前みたいなのがあったので、部分的には保存されていたりするんでしょうか、それとも違う何かの値かプロパティなんでしょうかね。
さて、最近引き続き調べているメモリフォレンジック的な方面で考えると、ダンプしたメモリイメージから画像を抽出する場合に、PNGを含めると、メモリ上に読み込まれたWORD文書に含まれる画像データとかも対象に入ってくると思われますが、逆にそういったデータを手掛かりに何か発展できたりするのでしょうかね。すぐに思いつくことないのであまり意味ないかもですが・・・
OpenOffice とかは文書ファイルに画像貼り付けると、そのままのデータ形式なんでしょうかね、それとも画像形式が変換されるのものがあるのか・・・