求助!python爬虫 re.findall匹配中文出错

ArialYeahh 2016-12-13 08:40:12

class Spider(object):
def Get(cls,url,pattern):
info = requests.get(url).content
result = re.findall(pattern,info)

for i in result:
print i
return result



MySpider =Spider()
result = MySpider.Get('http://www.xiachufang.com/',u"<a href=\"(.*?)title=\"(.*?)\" .*><span")


print info 可以正常显示中文
可是result中文都显示成了\xe4\xb8\x80\xe7\xa2\x97\xe7\xba\xa2\xe8\xb1\x86\xe6\xb2\x99
研究一天了,头都痛
...全文
370 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
ArialYeahh 2016-12-13
  • 打赏
  • 举报
回复
可以了! 谢谢谢谢,很感激
混沌鳄鱼 2016-12-13
  • 打赏
  • 举报
回复
这是因为你打印的是包含中文的列表原始字符串。你这样就可了


for t in result:
    print   '{0} {1}'.format(*t)

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧