如何抓取用js分页的下一页数据

蔡小波 2015-06-20 12:11:32

<a class="opac_blue1" href="javascript:gopage(2)">下一页</a>

它分页是javascript分页的，我提交表单上去一样获取不了，它的地址固定是http://61.142.33.201:8080/opac_two/search2/searchout.jsp这个，刚学不久，请问如何才能获取到下一页数据，我用httpclient抓的

...全文

691 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

bichir 2015-06-23

打赏
举报

你对他提交的参数做一下分析,你可以发现他用post提交了很多参数到服务器, 所以你在用httpclient抓取数据时就得提交这些参数。具体是哪些你可以点右键审查元素<input>这种标签里的东西,名字就是标签名name 比如你获取到了第一页数据后，要获取第二页就得把curpage加一个一，然后再用httplient请求一次。其实我看了这网站，他里面有一个size参数你可以把这个参数设为足够大,比如2000000000,然后curpage设为1, 你就可以最多一次获取2000000000条数据了，就可以不用翻页或分多次用httpclient获取了