爬虫 采集的数据如何分析

psj_JPS 2015-05-19 08:25:54
刚接触爬虫,需求是使用爬虫采集数据(设置关键字),对采集的数据进行按地区、时间、类别统计。如何把采集到的数据分析处理。分析出是哪种类别的、什么时间发生的、发生地属于哪个县市区。数据存储到mysql。用java
...全文
487 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
hellodcj 2015-06-25
  • 打赏
  • 举报
回复
1.需要用爬虫程序获得想要分析的文本信息。 2.用分词工具对文本进行分词 3.对于时间、地区等分词工具是可以进行词性标注的 4.自动分类可以用lucence提供的高级功能,自动分类,建议看下《lucence in action》

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧