社区
脚本语言
帖子详情
【提问】python解析网页源代码返回乱码问题
Harry_hoo
2013-10-15 07:47:19
代码
输出
直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码
求有用解决方案!!
...全文
1496
4
打赏
收藏
【提问】python解析网页源代码返回乱码问题
代码 输出 直接print中文是可以的,注释的中文也不会乱码,就解析网页乱码 求有用解决方案!!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
CDSoftwareWj
2013-10-18
打赏
举报
回复
.read().decode('gbk').encode('utf-8')
crifan
2013-10-18
打赏
举报
回复
帮你分析了字符串问题表象背后的原因 并给出了3种解决方案 但是又推测出你问题背后的条件,没给全, 然后又帮你分析是二进制乱码的原因 且也给出了解决办法 并且给出了,相关涉及到的各种知识,多对应的我所写的教程 需要的自己看吧:
【问题解答】python解析网页源代码返回乱码问题
jeky_zhang2013
2013-10-16
打赏
举报
回复
以前有个帖子也将到抓取编码的问题,可以参考下 http://bbs.csdn.net/topics/390564445
iasky
2013-10-16
打赏
举报
回复
1、你的内容直接 .encode('utf8')看看,换成你的编码格式 2、页面返回值是压缩的,gzip
python
html
网页
解析
错误怎么办_【
问题
解答】
python
解析
网页
源代码
返回
乱码
问题
| 在路上...
【
问题
】代码:输出:直接print中文是可以的,注释的中文也不会
乱码
,就
解析
网页
乱码
求有用解决方案!!【
问题
解答】从
问题
现象到
问题
本质,一点点帮你分析为何如何,以及如何解决
问题
1.首先,根据之前的
Python
的IDE的经验:从上述截图,基本上,可以推测出来,其用的是:2.所以,为了完全重现其
问题
,专门去PyDev中建立了对应的项目。代码为:# -*- coding: utf-8 -*-'''Cre...
BeautifulSoup
解析
网页
源代码
时出现字符丢失
问题
,可能是由于编码不匹配导致的。下面我将详细介绍这个
问题
以及可能的解决方案。
当
网页
源代码
中使用的编码方式与BeautifulSoup默认的编码方式不同,就会导致字符
解析
错误,从而出现字符丢失的情况。综上所述,通过指定正确的编码方式或自动检测编码方式,我们可以解决使用BeautifulSoup
解析
网页
源代码
时出现字符丢失的
问题
。这样,我们就能够准确地提取和处理
网页
中的数据,实现更有效的
网页
爬取任务。需要注意的是,如果以上方法仍然无法解决字符丢失的
问题
,可能是由于其他原因导致的。通过上述方法,我们可以根据
网页
的实际编码方式来正确
解析
网页
源代码
,避免出现字符丢失的
问题
。
python
爬取
网页
有
乱码
怎么解决
爬虫出现
乱码
python
爬取
网页
有
乱码
怎么解决_
Python
抓取
网页
乱码
的原因及解决方法
本篇文章给大家带来的内容是关于
Python
抓取
网页
乱码
的原因及解决方法,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。在用
python
2 抓取
网页
的时候,经常会遇到抓下来的内容显示出来是
乱码
。发生这种情况的最大可能性就是编码
问题
: 运行环境的字符编码和
网页
的字符编码不一致。比如,在 windows 的控制台(gbk)里抓取了一个 utf-8 编码的网站。或者,在 Mac / Li...
解决
Python
BeautifulSoup中文
乱码
问题
在上述示例中,我们使用chardet.detect()函数检测
网页
的编码方式,并将其存储在encoding变量中。然后,我们使用response.content.decode()方法将
网页
内容从检测到的编码方式转换为UTF-8,并将其存储在text变量中。然后,我们使用BeautifulSoup
解析
网页
时,将’html.parser’作为
解析
器,并将response.text作为输入。根据具体情况,选择适合的方法来解决中文
乱码
问题
,以确保正确
解析
网页
中的中文内容。如果你还有其他
问题
,请随时
提问
。
脚本语言
37,719
社区成员
34,239
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章