pagerank算法是在爬虫爬完后计算,还是边爬边算呢

warcao 2012-04-23 10:49:10
pagerank的具体意义呢?就是用于网页排序吗?爬虫需不需要这个功能呢?
现在做的一个爬虫,数据量较小,可以通过限制爬的层数快速爬完,也可以在内存中进行计算。
是不是爬完后生成一个图,根据出度入度来算呢?
看有些文章是根据pagerank过滤掉链接,直接不爬那些pr值低的网页,可是没爬完图都没有成型呀,怎么过滤呢。不能理解。
初学爬虫,很多概念不懂,请大家指教。
...全文
82 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
Kaile 2012-04-23
  • 打赏
  • 举报
回复
PR是每隔一段时间有专门的进程,机器来计算,间隔时间可能从几天到几个月,和网络爬虫没关系
cbzjzsb123 2012-04-23
  • 打赏
  • 举报
回复
PR是每隔一段时间有专门的进程,机器来计算,间隔时间可能从几天到几个月,和网络爬虫没关系

64,642

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧