Python 如何爬取相同url下，多个页面的链接内容

songwill2010 2015-07-20 09:51:59

初学Python爬虫，计划从大连商品交易所网站，爬取每日发布的PVC市场价格数据（http://www.dce.com.cn/portal/cate?cid=1329986308100）。

目前已能够从以上链接的第一页，把该页显示的市场价格链接爬取下来，并提取出价格信息（github托管的代码https://github.com/songwill/download-pvc-data/blob/master/pagelink.txt）。
但是点击第二页后，发现url和第一页显示的一模一样，不能用学过的循环去爬取接下来的第2页、第3页……的价格链接。求大神们指点下：
1、为什么不同页面内容会在同一个url下显示
2、要爬取后续页面里的链接，代码该如何写

...全文

7130 11 打赏收藏转发到动态举报

写回复

11 条回复

切换为时间正序

请发表友善的回复…

发表回复

挣扎的蓝藻 2019-03-08

打赏
举报

回复

可以看看这篇文章：Python 爬虫篇-爬取页面所有可用的链接

呵呵哒哒8 2019-02-10

打赏
举报

回复 2

在网页源码里面查看 url 就可以看到每个URL不一样只不过页面网址显示的URL一样你可以在源码的URL里面找到规律使用循环

屎克螂 2016-04-06

打赏
举报

回复

1、为什么不同页面内容会在同一个url下显示简单来说一个url就是代表一个页面，常常看到一个url展示不同数据是ajax局部刷新技术，这时浏览器的url并没有变，不过可以通过F12进入调试模式看到它走了一个新的url 2、要爬取后续页面里的链接，代码该如何写在浏览器上进入调试模式看看点击下一页提交的url 参数是什么然后用程序模拟出来

qq_34549941 2016-04-05

打赏
举报

回复 1

碰到了几乎一模一样的问题，帖子过去这么久，还是希望楼主能回复一下，想要请教这个问题。

PPJER 2015-09-25

打赏
举报

回复

引用 4 楼 network__yang 的回复:

F12 开调试功能就可以看到提交的表单数据

表单的方式怎么爬取，楼主能否给出样例代码

PPJER 2015-09-25

打赏
举报

回复

表单的方式怎么爬取，楼主能否给出样例代码

baidu_25048477 2015-09-25

打赏
举报

回复

你是怎么成功的？可以贴代码看看吗？我也遇到类似的了

夏天__ 2015-07-28

打赏
举报

回复

F12 开调试功能就可以看到提交的表单数据

zd96998 2015-07-24

打赏
举报

回复

你也可以先获取每个主题的url

songwill2010 2015-07-22

打赏
举报

回复

谢谢提醒，已通过查询post data ，用表单提交方式解决

sprawling 2015-07-20

打赏
举报

回复

利用提交表单的方式试试吧。

据说,python是方便抓取网页数据。今天让我们试试。它有多方便的对于python来抓取数据。介绍抓取数据,基本上得到这个网页的源代码通过网页的URL,并过滤出所需的信息根据源代码。准备IDE: pyCharm库:请求,\u2026进口lxml进口etree #链接url = ' http:\/\/www ' #循环得到分页我范围内(26):#找到关键字查询的页面数量={\u201C页面\u201...

御剑自带了字典，主要是分析字典中的网址是否存在，但是可能会漏掉一些关键的网址，于是前几天用python写了一个爬取网站全部链接的爬虫。实现方法主要的实现方法是循环，具体步骤看下图：贴上代码：# author: saucer_man# date:2018-04-24# python3.6import reimport requests# 获取并检验要爬取的网站def url_get():url=in...

在使用python爬虫进行网络页面爬取的过程中，第一步肯定是要爬取url，若是面对网页中很多url，，又该如何爬取所以url呢？本文介绍Python爬虫爬取网页中所有的url的三种实现方法：1、使用BeautifulSoup快速提取所有url；2、使用Scrapy框架递归调用parse；3、在get_next_url()函数中调用自身，递归循环爬取所有url。方法一：使用BeautifulSoup...

本文讲解该如何爬取之后的页面信息，希望对你有帮助一、审查元素鼠标移至页码处右键，选择检查元素接着屏幕下方就会出现对应的html语句二、分析html语句与项目要求本次项目是爬取所有信息，根据第一步中的html语句，我们有两种爬取后续页面信息的方法：方法一：循环访问本页面中的“下一页”链接直至该标签为空即 ''' 遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939 寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！ ''' def nex

Python 爬取多页网页代码

37,743

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章