【提问】python解析网页源代码返回乱码问题

Harry_hoo 2013-10-15 07:47:19
代码
输出
直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码
求有用解决方案!!
...全文
784 点赞 收藏 4
写回复
4 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
CDSoftwareWj 2013-10-18
.read().decode('gbk').encode('utf-8')
回复
crifan 2013-10-18
帮你分析了字符串问题表象背后的原因 并给出了3种解决方案 但是又推测出你问题背后的条件,没给全, 然后又帮你分析是二进制乱码的原因 且也给出了解决办法 并且给出了,相关涉及到的各种知识,多对应的我所写的教程 需要的自己看吧: 【问题解答】python解析网页源代码返回乱码问题
回复
jeky_zhang2013 2013-10-16
以前有个帖子也将到抓取编码的问题,可以参考下 http://bbs.csdn.net/topics/390564445
回复
iasky 2013-10-16
1、你的内容直接 .encode('utf8')看看,换成你的编码格式 2、页面返回值是压缩的,gzip
回复
相关推荐
发帖
脚本语言
创建于2007-08-27

3.7w+

社区成员

JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
申请成为版主
帖子事件
创建了帖子
2013-10-15 07:47
社区公告

CSDN 脚本语言社区接受专栏投稿(专栏会在顶部创建专属你的栏目),投稿需满足以下要求:

  • 脚本语言技术相关;
  • 文章持续更新,保持活跃;
  • 内容清晰明了,干货为主;
  • 文章排版有序,有条有理。

本社区开通招聘专栏,发布招聘信息请联系版主,发布者需要保证招聘信息真实有效,CSDN 平台和版主不对招聘内容负责!

联系方式:私聊版主、发送邮件、QQ联系等均可: