37,720
社区成员
发帖
与我相关
我的任务
分享
import re
import struct
t = 'æ¦é³åº'
m = re.findall('&#(\d+);?', t)
n = struct.pack('%dB' % len(m), *[int(a) for a in m])
print n.decode('utf-8')
>>> import struct
>>> sen = struct.pack('BBBBBBBBB', 230,166,134,233,152,179,229,140,186)
>>> sen
b'\xe6\xa6\x86\xe9\x98\xb3\xe5\x8c\xba'
>>> sen.decode('utf-8')
'榆阳区'
用array模块应该速度更快,可以自己参考手册