两亿条记录会有什么后果,没分了,会追加

jronald 2008-03-01 12:13:15
先说明一下,是单词统计,记录需要一起参与统计
有两个疑问
1.加记录,有聚集索引,到后面是否会严重影响记录追加速度?
2.简单查询(无子查询,最多加个DISTINCT,如(
SELECT COUNT(DISTINCT name) FROM t WHERE ...
)
,速度会怎样?
...全文
128 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
华芸智森 2008-03-03
  • 打赏
  • 举报
回复
2亿还用数据库?
用OLAP统计.
rqrq 2008-03-03
  • 打赏
  • 举报
回复
为什么每次都要COUNT?用一张表来记录数量不是很好吗?
welove1983 2008-03-03
  • 打赏
  • 举报
回复
直接挂掉 ...!
- -
分库吧

过百万的数据 使用 count基本上就是老汉推车了
大数据量使用count是极度慢的.

如果有ID
那么 按ID 分
每XXXX条记录为一段
取个count
然后 多个 count+起来
别一起count
rqrq 2008-03-03
  • 打赏
  • 举报
回复
从a-z,建立26个表吧
flairsky 2008-03-03
  • 打赏
  • 举报
回复
1、name 在插入待查询表的时候换成对应nameid
nameid name 形成关系表
2、nameid上建立聚集索引
3、distinct 2亿 ,不符合数据库设计规则……
4、有索引插入当然慢,何况数据如此大,建议做水平分区,分别置于不用IO设备上
5、返回结果量如果很小,建议索引做大做全,插入操作在空闲时进行,累积一定量插入后,删除索引后一次性插入,再建立索引。


seemon 2008-03-03
  • 打赏
  • 举报
回复
NAME上做clustered index可能会好点吧,不过应该还是够慢的
fcuandy 2008-03-01
  • 打赏
  • 举报
回复
distinct 或者 group by 去重的效率是很低的(跟直接select 相比)
两亿条数据,没有实用的经验,所以不知道.
tianyan316 2008-03-01
  • 打赏
  • 举报
回复
没试过那大的数据``但你用DISTINCT效率肯定不会高``插入数据效率也低
jacklee_888 2008-03-01
  • 打赏
  • 举报
回复
在開table 架構時把此問題考慮在內﹐就可以不用這么寫。那么多資料這么寫肯定速度不會好到哪里
samson_www 2008-03-01
  • 打赏
  • 举报
回复
用sql2005的分区表应该速度影响会小些不?

34,587

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server相关内容讨论专区
社区管理员
  • 基础类社区
  • 二月十六
  • 卖水果的net
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧