爬虫时page_source遇到编码错误

翰璞学生会员 2019-08-28 07:16:34
使用了selenium,网页是58同镇 手机网页

报错信息
selenium.common.exceptions.InvalidArgumentException: Message: unexpected end of hex escape at line 1 column 13533

百度无果,试了很多办法没办法,就是pagesource获取源码的时候报错的,下拉页面到一定程度的时候就报错了,或者爬一段时间也是这样。
请问有没有别的能不报错拿到html的方法。或者这个怎么解决。。。

source = self.driver.page_source
...全文
638 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
WPP7 2022-03-11
  • 打赏
  • 举报
回复

天哪,两年后的我也遇到了这个问题,还是搜不出来解决方法

翰璞学生会员 2019-08-29
  • 打赏
  • 举报
回复
顶一下。。。有人知道嘛

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧