java 实现网络爬虫用哪个爬虫框架比较好？

jywai 2012-05-25 02:34:46

大家哈，我想用java 实现一个网络爬虫的程序，请问用什么爬虫框架比较好，比如说我要抓取一些游戏传媒信息。用什么技术框架好！？？请大家帮忙支支招，谢谢！

...全文

30318 7 打赏收藏转发到动态举报

写回复

用AI写文章

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

小傅哥 2013-03-12

打赏
举报

推荐一个Jsoup 看一下，感觉这个不错

http://tieba.baidu.com/p/2114471038

小伙 2013-03-12

打赏
举报

httpclient不错

晴天_设计师 2013-03-11

打赏
举报

共有31款Java 网络爬虫开源软件，网址：http://www.oschina.net/project/tag/64/spider?lang=19&os=0&sort=view&p=1，其中Nutch和Heritrix比较流行

gloomyfish 2012-12-28

打赏
举报

如果你是做项目，建议你用框架如果你是真的想提高自己能力，作为爱好研究一下，建议你研究框架源码，

muxiaoyu1 2012-12-27

打赏
举报

自己写爬取程序吧看你业务需求了你针对的是什么了最好说的详细点一般来说可以通过该网站的API搜索信息，这是最快最准的。如果不行就拼凑连接自己解析。最后还是不行就只有最笨最慢最不稳定的方法爬网页解析。N多方法最好使用API最不好就爬网页。

面包里的代码 2012-12-27

打赏
举报

楼主，我也碰到你这样的问题，不知道你学的怎么样了？求指点

thisisnew 2012-05-29

打赏
举报

爬虫有框架吗？好像只有一些开源的实现吧，Heritrix比较适合，而且用的比较多，可以自由定制，网上相关的中文资料也比较多

基于java实现的java爬虫，是我学习java来练练手的，java基础入门的学生可以考虑参考一下

为本人毕业设计，内含数据库结构、程序源码、论文。程序使用框架springBoot+Mybatis+WebMagic，数据库为MySQL。论文经过查重。

java实现网络爬虫并存到数据库，里面一个demo可直接运行，没有数据库sql，自己可以根据xml文件创建数据库 mybitis实现

需要maven构建建议使用idea

Java网络爬虫源码

非技术区

23,408

社区成员

70,517

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章