关于csdn 帖子最后更新时间排序问题

seqwait 邂逅网 软件工程师  2015-08-17 10:31:35
csdn 帖子都是海量数据,按照最后更新时间进行排序,但是如果按照limit x,x 的话当数据量非常大的时候就显得非常慢了,但是如果按照 lastUpdateTime>= 的话分页可能有重复数据,这个该怎么破?
...全文
79 点赞 收藏 10
写回复
10 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
HinanaiTenshi 2015-08-17
一般是做了冷热分离、数据结转或者时间分区之类的处理吧,论坛的常用数据量远远小于历史数据。 mysql时间分区如果做的好,1亿数据的简单查询大概几百毫秒。
回复
Defonds 2015-08-17
引用 7 楼 oZhiMing12 的回复:
[quote=引用 5 楼 defonds 的回复:] 都在同一张表里的话,肯定慢的不行。 分表、分库。 而且应该还有前端、后端缓存。
引用那采取哪一种分页比较好呢? 直接 limit ?,? 但是假如有上千万条数据呢?[/quote]一般 limit 就可以了。 其他的不是那么精确的。 sql、索引写的好,而且表结构组织的好的话,单表千万也不是问题
回复
引用 6 楼 oZhiMing12 的回复:
[quote=引用 3 楼 shijing266 的回复:] 还有这个
我用的是mysql 最后更新时间,不是ID 最后更新时间是实时变化的不能根据ID[/quote] 你要问的是分页吧? 排序不就直接order by XXX desc了?
回复
seqwait 2015-08-17
引用 5 楼 defonds 的回复:
都在同一张表里的话,肯定慢的不行。 分表、分库。 而且应该还有前端、后端缓存。
引用那采取哪一种分页比较好呢? 直接 limit ?,? 但是假如有上千万条数据呢?
回复
seqwait 2015-08-17
引用 3 楼 shijing266 的回复:
还有这个
我用的是mysql 最后更新时间,不是ID 最后更新时间是实时变化的不能根据ID
回复
Defonds 2015-08-17
都在同一张表里的话,肯定慢的不行。 分表、分库。 而且应该还有前端、后端缓存。
回复
gukuitian 2015-08-17
CSDN的数据量真不大, 你看看这java版的帖子,才13W出头,加个索引直接查都完全没问题
回复
回复
这个就看csdn用的是什么数据库了...
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2015-08-17 10:31
社区公告
暂无公告