网络爬虫抓下来的数据,快照是什么

chenchenlin0811 2016-08-17 08:02:47
小弟新手,刚接触网络爬虫,我想知道抓下来的数据,快照是什么,怎么分析
...全文
491 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
hanguoji84 2016-08-19
  • 打赏
  • 举报
回复
爬虫的过程是 爬取网页,然后分析网页把非文字性信息剔除,保留文字后进行分词,分词是一种算法,跟你本地的词库进行对比,分好的词入库,检索时对比词库进行文章匹配 找出文章,标红 检索词。
hanguoji84 2016-08-19
  • 打赏
  • 举报
回复
快照就是你当时爬取下来的html,并且把对应的关键词标红了,保存到本地的HTML文件。

58,454

社区成员

发帖
与我相关
我的任务
社区描述
Java Eclipse
社区管理员
  • Eclipse
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧