关于Unihan Database汉字解码问题,一个汉字对应三个编码,如何利用编码反编码汉字回来呢?
关于Unihan Database汉字解码问题,一个汉字对应三个编码,如何利用编码反编码汉字回来呢?
也就是Unicode转GB2312的算法吗?
在这个地址
http://www.unicode.org/charts/unihan.html
我们输入:汉字解码问题,然后Lookup
提交时在地址栏里已经出现:
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=%E6%B1%89%E5%AD%97%E8%A7%A3%E7%A0%81%E9%97%AE%E9%A2%98
结果是:
Unihan data for U+%E6%B1%89%E5%AD%97%E8%A7%A3%E7%A0%81%E9%97%AE%E9%A2%98
也就是一个汉字对应三个编码!
如果我现在得到的编码过的数据:%E6%B1%89%E5%AD%97%E8%A7%A3%E7%A0%81%E9%97%AE%E9%A2%98
如何才能反编码为:汉字解码问题,这六个字回来呢?