【提问】python解析网页源代码返回乱码问题

Harry_hoo 2013-10-15 07:47:19
代码
输出
直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码
求有用解决方案!!
...全文
1496 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
CDSoftwareWj 2013-10-18
  • 打赏
  • 举报
回复
.read().decode('gbk').encode('utf-8')
crifan 2013-10-18
  • 打赏
  • 举报
回复
帮你分析了字符串问题表象背后的原因 并给出了3种解决方案 但是又推测出你问题背后的条件,没给全, 然后又帮你分析是二进制乱码的原因 且也给出了解决办法 并且给出了,相关涉及到的各种知识,多对应的我所写的教程 需要的自己看吧: 【问题解答】python解析网页源代码返回乱码问题
jeky_zhang2013 2013-10-16
  • 打赏
  • 举报
回复
以前有个帖子也将到抓取编码的问题,可以参考下 http://bbs.csdn.net/topics/390564445
iasky 2013-10-16
  • 打赏
  • 举报
回复
1、你的内容直接 .encode('utf8')看看,换成你的编码格式 2、页面返回值是压缩的,gzip

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧