关于网络爬虫返回结果的问题

p13102568159 2008-12-18 08:19:26
刚开始做网络爬虫,都很不熟悉,希望大家帮忙:

就是找一个比较新的技术的网页,比如纳米技术,然后把与这个技术相关的所有网页的URL都下载到本地,在这些URL之间寻找联系,比如1网页和2网页连接,就返回1,不连接就返回0,最后得到的结果是这些URL之间的关系矩阵

最主要的问题是,怎么返回一个矩阵。

还有要实现这些功能用那个软件最好,.NET中的C#, JAVA,这两个我都学过,不知道用哪个更好些。。。

拜托大家了。。
...全文
181 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
elias 2011-09-30
  • 打赏
  • 举报
回复
正要来接触网络爬虫技术,我也是C#和Java都OK,现在对爬虫仅仅是概念上的认识,希望给点建议,弱弱的问句有推荐的书看不?需要涉及到哪些技术?
p13102568159 2008-12-26
  • 打赏
  • 举报
回复
拜托大家了。。。
p13102568159 2008-12-19
  • 打赏
  • 举报
回复
能不能说一说具体的思想,或者我应该去着重看哪些书,我昨天个刚把ECLIPES装上,现在还是很迷茫,拜托2楼了。。。
lisl2003 2008-12-18
  • 打赏
  • 举报
回复
不懂
liuxiaoyun 2008-12-18
  • 打赏
  • 举报
回复
建议用JAVA,JAVA中的Hashtable和HashMap对存储、读取二维或多维的矩阵数据很方便的,如果要防止URL存储的重复的情况下,大多数情况可以用LinkedList
云想慕尘 2008-12-18
  • 打赏
  • 举报
回复
c#

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧