求各位大佬解答爬虫网址变化的问题

az.阳光薄荷�銮 2020-05-13 11:39:57
各位专家们:

本人新手,遇到网址变化问题,有点没头绪了,网址如下:

http://www.****.cn/newepaper/pc/layout/202005/13/node_001.html

这是某报纸电子版的网址,这个网址只有/202005/13/node_001.html 这个部分是变化的,

/202005/13/这个部分就是日期,但是每个月里面节假日没有报纸,所以不包括。

/node_001.html 这个部分是版面,变化规律是每天的日期后面会有node_001--008,但是1-8没有规律,有时是1-4,有时1-8,有时还会缺一个。

那么我怎么才能用python简洁地设置一个有规律“URL”,遍历出一个月里面所有出现的版面的内容呢?


求解答~~~~
...全文
260 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
liups 2020-05-18
  • 打赏
  • 举报
回复
都学到爬虫了,还不明白这个? 另外,既然是爬虫,就不需要搞明白这个,本来就是从其他地方获得真实网址的,比如一个索引页面

3,423

社区成员

发帖
与我相关
我的任务
社区描述
其他开发语言 其他开发语言
社区管理员
  • 其他开发语言社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧