已知字符编码和字符的二进制形式,求原字符

1485阅读 0评论2009-06-07 lululau
分类:

比如通过:
liuxiang@MacBookPro: ~/Downloads $ echo "test123汉字" | iconv -t GBK | od -Ad -tx1
0000000    74  65  73  74  31  32  33  ba  ba  d7  d6  0a               
0000012
我们获得了字符串"test123汉字"的GBK编码的二进制形式,并且我们已知编码是GBK,那么怎样获得源字符串"test123汉字"呢?

liuxiang@MacBookPro: ~/Downloads $ echo '74  65  73  74  31  32  33  ba  ba  d7  d6  0a' | sed 's/[0-9a-fA-F][0-9a-fA-F]/0x&/g' | perl -ne '
> @hexs=split(" ");
> for(@hexs){
> print pack("c", hex());
> }
> ' | iconv -f GBK
test123汉字
liuxiang@MacBookPro: ~/Downloads $
上一篇:关于mp3的TAG
下一篇:原来windows上的NTFS也支持硬链接