æ¦†é˜³åŒº上面是三个unicode十进制内码，怎么转换，急！！

北門大官人 2013-01-13 02:03:24

如题，刚刚遇到了这个问题，在网上找了找，没有找到，不知道该怎么解决了？

...全文

761 7 打赏收藏转发到动态举报

写回复

用AI写文章

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

ImN1 2013-01-13

打赏
举报

? 那是你的字符串最后的转换结果

北門大官人 2013-01-13

打赏
举报

引用 2 楼 snmr_com 的回复:

Python code?123456>>> import struct>>> sen = struct.pack('BBBBBBBBB', 230,166,134,233,152,179,229,140,186)>>> senb'\xe6\xa6\x86\xe9\x98\xb3\xe5\x8c\xba'>>> sen.decode('utf-8')'榆阳区' 用arra……

哈哈，哥们，你也是榆林的啊？我也是榆林的

北門大官人 2013-01-13

打赏
举报

引用 3 楼 bugs2k 的回复:

Python code?1234567import reimport struct t = 'æ¦é³åº'm = re.findall('&#(\d+);?', t)n = struct.pack……

非常好，谢谢，小弟刚刚入门python，在公司做搜索引擎，用python写的，今天又学习了一招。呵呵

北門大官人 2013-01-13

打赏
举报

引用 2 楼 snmr_com 的回复:

Python code?123456>>> import struct>>> sen = struct.pack('BBBBBBBBB', 230,166,134,233,152,179,229,140,186)>>> senb'\xe6\xa6\x86\xe9\x98\xb3\xe5\x8c\xba'>>> sen.decode('utf-8')'榆阳区' 用arra……

非常好，谢谢

bugs2k 2013-01-13

打赏
举报

import re
import struct

t = 'æ¦é³åº'
m = re.findall('&#(\d+);?', t)
n = struct.pack('%dB' % len(m), *[int(a) for a in m])
print n.decode('utf-8')

ImN1 2013-01-13

打赏
举报


>>> import struct
>>> sen = struct.pack('BBBBBBBBB', 230,166,134,233,152,179,229,140,186)
>>> sen
b'\xe6\xa6\x86\xe9\x98\xb3\xe5\x8c\xba'
>>> sen.decode('utf-8')
'榆阳区'

用array模块应该速度更快，可以自己参考手册

ImN1 2013-01-13