社区
脚本语言
帖子详情
【提问】python解析网页源代码返回乱码问题
Harry_hoo
2013-10-15 07:47:19
代码
输出
直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码
求有用解决方案!!
...全文
1603
4
打赏
收藏
【提问】python解析网页源代码返回乱码问题
代码 输出 直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码 求有用解决方案!!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
CDSoftwareWj
2013-10-18
打赏
举报
回复
.read().decode('gbk').encode('utf-8')
crifan
2013-10-18
打赏
举报
回复
帮你分析了字符串问题表象背后的原因 并给出了3种解决方案 但是又推测出你问题背后的条件,没给全, 然后又帮你分析是二进制乱码的原因 且也给出了解决办法 并且给出了,相关涉及到的各种知识,多对应的我所写的教程 需要的自己看吧:
【问题解答】python解析网页源代码返回乱码问题
jeky_zhang2013
2013-10-16
打赏
举报
回复
以前有个帖子也将到抓取编码的问题,可以参考下 http://bbs.csdn.net/topics/390564445
iasky
2013-10-16
打赏
举报
回复
1、你的内容直接 .encode('utf8')看看,换成你的编码格式 2、页面返回值是压缩的,gzip
二维码生成工具QRCode
源代码
支持中文(解决解码时中文
乱码
)
我是这个资源的上传者,这个资源是老版本资源了。 新版本同功能的资源在http://download.csdn.net/detail/5653325/5077697
python
html
网页
解析
错误怎么办_【
问题
解答】
python
解析
网页
源代码
返回
乱码
问题
| 在路上...
【
问题
】代码:输出:直接print中文是可以的,注释的中文也不会
乱码
,就
解析
网页
乱码
求有用解决方案!!【
问题
解答】从
问题
现象到
问题
本质,一点点帮你分析为何如何,以及如何解决
问题
1.首先,根据之前的
Python
的IDE的经验:从上述截图,基本上,可以推测出来,其用的是:2.所以,为了完全重现其
问题
,专门去PyDev中建立了对应的项目。代码为:# -*- coding: utf-8 -*-'''Cre...
python
爬取
网页
有
乱码
怎么解决_
Python
抓取
网页
乱码
的原因及解决方法
本篇文章给大家带来的内容是关于
Python
抓取
网页
乱码
的原因及解决方法,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。在用
python
2 抓取
网页
的时候,经常会遇到抓下来的内容显示出来是
乱码
。发生这种情况的最大可能性就是编码
问题
: 运行环境的字符编码和
网页
的字符编码不一致。比如,在 windows 的控制台(gbk)里抓取了一个 utf-8 编码的网站。或者,在 Mac / Li...
python
如何获取
网页
源代码
并保存本地_
python
爬取csdn
网页
并保存博客到本地
这几天一直在学用
python
爬
网页
, 现在是用urllib2,cookie等模块获取了csdn的博客源码,然后打算把所有博客都保存到本地;这就涉及到了
解析
html, 由于对正则的理解不太深。。。就用了第三方工具模块:美丽的汤---BeautifulSoup ,可以自己百度安装,使用教程,很容易上手: 代码不健壮。。主要是容易出现
乱码
。。 有时候遇到全角的时候也会出bug,以后再完善吧。先贴张保...
BeautifulSoup
解析
网页
源代码
时出现字符丢失
问题
,可能是由于编码不匹配导致的。下面我将详细介绍这个
问题
以及可能的解决方案。
当
网页
源代码
中使用的编码方式与BeautifulSoup默认的编码方式不同,就会导致字符
解析
错误,从而出现字符丢失的情况。综上所述,通过指定正确的编码方式或自动检测编码方式,我们可以解决使用BeautifulSoup
解析
网页
源代码
时出现字符丢失的
问题
。这样,我们就能够准确地提取和处理
网页
中的数据,实现更有效的
网页
爬取任务。需要注意的是,如果以上方法仍然无法解决字符丢失的
问题
,可能是由于其他原因导致的。通过上述方法,我们可以根据
网页
的实际编码方式来正确
解析
网页
源代码
,避免出现字符丢失的
问题
。
脚本语言
37,743
社区成员
34,212
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章