求抓取网络数据的思路,方案!!!

sundeveloper 2007-01-22 05:52:00

比如: 我的关键字为"刘德华", 我就需要去指定的某些网站,,抓取刘德华的一些信息.

用什么框架,方法比较好使,谢谢!
...全文
385 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
v8v4ygsk88 2011-01-16
  • 打赏
  • 举报
回复
g................
yz_ivan 2007-01-23
  • 打赏
  • 举报
回复
写个Httpclient直接用Google,Baidu之去搜索然后这里一下返回的结果
luyang1016 2007-01-23
  • 打赏
  • 举报
回复
四个内裤
lzmhehe 2007-01-23
  • 打赏
  • 举报
回复
mark
脚本无敌 2007-01-23
  • 打赏
  • 举报
回复
blog 更新:
think in java 各章后练习答案.....
http://blog.csdn.net/heimaoxiaozi/
sundeveloper 2007-01-23
  • 打赏
  • 举报
回复

1. 返回的页面格式的不确定.(内容有可能在div中,也有可能在td中,等..)
2. 返回的页面的内容,也不确定.(页面中,既有可用的信息,也有没有的(广告等)信息..)
sundeveloper 2007-01-23
  • 打赏
  • 举报
回复

我是打算用去Google搜索,根据Google返回的结果集,再去访问结果集对应的链接.最将访问链接得到的页面返回.
得到页面的HTML代码后,我有几个头痛的问题.

1. 返回的页面格式的不确定.
2. 返回的页面的内容,也不确定.
3. 如何得到该关键字的 比较完整的,详细,而且比较相关的信息.
4. 这些操作,不需要人工干预,一切都需自动处理.

lixiaoxue85 2007-01-22
  • 打赏
  • 举报
回复
网络爬虫? 这和用社么框架有社么关系吗~~你习惯社么用社么
醉杯殇 2007-01-22
  • 打赏
  • 举报
回复
框架?
Spider?
Google,Baidu,SoGou...

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧