网页爬虫,只爬指定区域(或说指定table)中的内容可以做到么?(java)

yuboyq01 2010-04-14 11:44:40
【对网页爬虫不了解,也没看过代码。更没用过。所以请好心朋友回答的时候能说的通俗点。】

我想要的结果是这样的:例如一个网页由很多个div或者table组成。我只需要取其中一个div或者table的信息内容,然后再进行整理。
比如一个新闻网站的首页板块里其中有一部分是这样的:

新闻1 xxxx
新闻2 XXXXX
新闻3 XXXXX
新闻4 ASSS

我只要这个板块里的 【新闻标题list】。
定时去抓取下来后,存在自己的数据库中,再进行其它的处理。

请问: 现有的常见的爬虫程序具备这样的功能不?或者要实现这样的功能大致的思路是怎样的?
...全文
206 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
yayalanlan 2011-11-23
  • 打赏
  • 举报
回复
[Quote=引用 6 楼 yueweiac110 的回复:]
可以实现
根据标签的id或者nana属性可以取到
[/Quote]

如果没有id和name呢?怎么弄呢?
jisg_57 2010-04-15
  • 打赏
  • 举报
回复
来学习一下
kString 2010-04-15
  • 打赏
  • 举报
回复
爬虫好像都能实现你要的功能。
qq262067995 2010-04-15
  • 打赏
  • 举报
回复
期待中 帮LZ 顶!
yueweiac110 2010-04-15
  • 打赏
  • 举报
回复
可以实现
根据标签的id或者nana属性可以取到
z2008g 2010-04-15
  • 打赏
  • 举报
回复
up,.............
woaiyanzic 2010-04-15
  • 打赏
  • 举报
回复
这虫子是干吗的~~学习学习~~关注中

81,114

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧