新浪微薄的热门话题如何实现?

zss503 2010-08-30 09:47:40
我想问下新浪微薄的热门话题榜是如何统计出来的?
...全文
139 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
cheng20100915 2010-08-30
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 zss503 的回复:]
引用 1 楼 cooljia 的回复:

新浪热门话题归类到诸如美女,帅哥,足球,游戏之类下面去肯定不是程序能够自动做到的。
我猜想做法应该是:
1. 新浪微博编辑从无到有积累编辑话题数据库。每天根据新闻或者标签tag,热门话题新闻人物不断更新话题数据库,话题数据库可以是人名,物品,事件,状态等。
2. 根据话题数据库逐条定时扫描,比如一小时微博数量,具体的实现可能设计到多服务器分布式处……
[/Quote]
都是牛人
zss503 2010-08-30
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 cooljia 的回复:]

新浪热门话题归类到诸如美女,帅哥,足球,游戏之类下面去肯定不是程序能够自动做到的。
我猜想做法应该是:
1. 新浪微博编辑从无到有积累编辑话题数据库。每天根据新闻或者标签tag,热门话题新闻人物不断更新话题数据库,话题数据库可以是人名,物品,事件,状态等。
2. 根据话题数据库逐条定时扫描,比如一小时微博数量,具体的实现可能设计到多服务器分布式处理,最后汇总。


不清楚微博每天每小……
[/Quote]

虽然对我做微博没有实质性的帮助,不过还是要谢谢你分享你的见解,让我从中学习了一下。
cooljia 2010-08-30
  • 打赏
  • 举报
回复
新浪热门话题归类到诸如美女,帅哥,足球,游戏之类下面去肯定不是程序能够自动做到的。
我猜想做法应该是:
1. 新浪微博编辑从无到有积累编辑话题数据库。每天根据新闻或者标签tag,热门话题新闻人物不断更新话题数据库,话题数据库可以是人名,物品,事件,状态等。
2. 根据话题数据库逐条定时扫描,比如一小时微博数量,具体的实现可能设计到多服务器分布式处理,最后汇总。


不清楚微博每天每小时的发布数据量是多少,不过我猜想原创的数据量不会很大,更多的是转发和评论,而转发和评论目前来看是不计入热门话题的。即便以每小时百万量级的数据来说,是完全可以做出比较详细的统计的。

81,114

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧