这种网站爬去遇到问题请问怎么回事?

江南大富翁 2017-11-08 03:23:32
想去爬虫 无讼案例 上面的案例进行学习,打开一个网页是能看到内容,可是看源代码都是主页的源代码,python爬下来的也都是主页的源代码,请问大家,这是怎么回事儿?
...全文
165 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
CaiNiaoWuZui 2017-11-08
  • 打赏
  • 举报
回复
爬下来的当然都是主页源代码,网页的内容就包含在源代码里面。使用正则表达式/lxml/beautifulsoup 提取你想要的内容就行了。 如果源代码里面没有你想要的内容,那用f12看看要发哪一个请求才能得到你的内容。 如果看到的是乱码,那么decode()解码一下即可.
oyljerry 2017-11-08
  • 打赏
  • 举报
回复
是否扒取到正确URL了。内容不对,是不是页面异步加载的

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧