Python 以浏览器伪装技术爬取网站首页的链接,查看网页源代码如图所示,如何写正则表达式?

LeafDream_ 2019-03-22 08:13:29
感觉是正则那里出了问题,爬不到内容。
第一张图为随意选取的网页,第二张图为选取网页的标签,第三张图为代码。不知道是不是正则表达式书写错误, 运行不报错也爬不到相应内容。


...全文
309 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
LeafDream_ 2019-03-24
  • 打赏
  • 举报
回复
学框架前想把底层的细节给弄清楚,希望能指点下。 ajax反扒我没做,但是应该不用做也可以爬取到网页。但是程序没报错,估计是正则那里分析出错了。但是按照内容所在的相邻标签将内容替换成(.*?),我理解上是可以的。
荇䔽Boso 2019-03-22
  • 打赏
  • 举报
回复
一般用框架去爬没那么多问题我电脑上有一整套现成的代码,你改下就能用那种可惜,火车上wifi渣帮不了你
荇䔽Boso 2019-03-22
  • 打赏
  • 举报
回复
做了ajax反扒吧?

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧