根据显示的页面把后续页面的urls给读取出来

java_dream_fly 2011-03-19 10:16:43

http://s.taobao.com/search?q=%B7%FE%CE%F1%C6%F7%BB%FA%B9%F1&keyword=&commend=all&ssid=s5-e&search_type=item&atype=&tracelog=&sourceId=tb.index

这个页面下方显示了6个可以直接点击的后续页面，实际上后续页面多达100个。需要把这个100个页面的URLs提取出来。

拜托各位一下，有没有什么好的方法可以快速读取出来。最好附上您的方法吧，谢谢！

...全文

67 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

huangli21 2011-03-20

打赏
举报

回复

不懂、题目意思~~~顶起来

java_dream_fly 2011-03-20

打赏
举报

回复

就是分页显示的页码数，比如说 1 2 3 4 5 6 ......共100页，只显示出了6个，然后查看点击第一页时显示的链接，再看第二页的超链接地址，这样推敲吧，要写代码吧！

runer 2011-03-19

打赏
举报

回复

不要从分析页面入手，taobao open API提供这样的功能

http://open.taobao.com/

通过源码目录下的urls.txt文件中的每一行的内容作为网页地址，获取行数打开对应数量的网页源码功能简单，适合初学者学习。注意：开发环境为Visual Studio 2010

从html中分析提取链接(url) (5KB)

讲述Django的概念、作用以实例方式讲述Django中路径设置(urls)的各项用法。以实例方式讲述Django中视图方法、通用视图的应用以实例方式讲述Django中模型的运用以实例方式讲述Django中模板的使用情况以IIS方式部署Django工程

基于Python的电子资源可用性检测方案

浅谈多个有序ajax访问示例近期在学习使用js时碰到了一些问题，而后解决，期间的一点经验与大家分享。

23,407

社区成员

70,565

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章