抓取网页内容时遇到的问题

PHP编程者 2010-12-01 09:47:57
新蛋网的商品页的url的命名规则是什么,分析了半天也没分析出来,比如:http://www.newegg.com.cn/Product/36-c04-400.htm中的(36-c04-400)规则是什么,也就是说如何批量获得商品编号?请各位指点下
...全文
93 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhongqixing1104 2010-12-01
  • 打赏
  • 举报
回复
找几个产品对比下就知道了。36-c04-400。笔记本前面两位都是36,上网本台式机都是35,c04,thinkpad E40的都是c04,Dell 戴尔 Inspiron都是c08,最后三位应该是产品的id
PHP编程者 2010-12-01
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 alex_best 的回复:]

不可能~~你只能抓取全站所有的链接 然后进行分析
你也可以先看看他们的链接有什么规律,只抓你需要的~~
[/Quote]上面的网站的链接规律是什么呢,我猜了猜,可效率很低啊,http://www.newegg.com.cn/Product/**-c**-***.htm,其中*代表一位数字
igaojie 2010-12-01
  • 打赏
  • 举报
回复
不可能~~你只能抓取全站所有的链接 然后进行分析
你也可以先看看他们的链接有什么规律,只抓你需要的~~
PHP编程者 2010-12-01
  • 打赏
  • 举报
回复
在线等,急等着用

4,250

社区成员

发帖
与我相关
我的任务
社区描述
国内外优秀PHP框架讨论学习
社区管理员
  • Framework
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧