@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

2004-12-12

対・アンチ

UTF-8 の 4byte でエンコードされている場合*1、効率よくデコードするにはどういう手段がいいんすかねぇ。

F    0    8    F    B    B    B    F
1111 0000 1000 1111 1011 1011 1011 1111
1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx
---------------------------------------
      000   00 1111   11 1011   11 1111 (FEFF)

F    0    8    3    8    1    A    F
1111 0000 1000 0011 1000 0001 1010 1111
1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx
---------------------------------------
      000   00 0011   00 0001   10 1111 (306f)

*1:http://archive.openmya.devnull.jp/2004.12/msg02056.html