海量数据，datetime字段做索引非常慢，怎么办？怎么办？？？？求大牛，，，求大牛，，，求大牛

rd16 2014-05-13 10:59:31

加精

我有一个表大概有5百万条数据，表结构大致如下：

id (int 类型，自增主键+聚集索引）
i_本级代理id （int 类型，非聚集索引）
i_下级代理id （int 类型，非聚集索引）
i_本级占成金额
.....其它字段略
i_结单时间（datetime类型，非聚集索引）

***************************************************

我的SQL语句如下（大致返回20条数据行，用时27秒）



declare @d datetime

set @d=getdate()



  DECLARE @userid int

  DECLARE @startsj datetime

  DECLARE @endjs datetime





  SET @userid =1

  SET @startsj ='2011-03-31 00:00:00'

  SET @endjs   ='2015-03-31 00:00:00'

  





SELECT 

 下级代理名=(select top 1 i_用户名 FROM  T_会员 WHERE i_用户id=A.i_下级代理id),

 下级占成金额=(select SUM(i_本级占成所得) FROM  T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs),

 下级退佣金额=(select SUM(i_本级退佣金额) FROM  T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs),

 下级赚佣金额=(select SUM(i_本级赚佣金额) FROM  T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs),

 下级盈亏=(select SUM(i_本级盈亏) FROM  T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs),

 本级交上级=(select SUM(i_本级交上级) FROM  T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs),

 



 SUM(i_会员购买金额) AS 会员购买金额,

 SUM(i_本级占成所得) AS  本级占成所得,

 SUM(i_本级退佣金额) AS  本级退佣金额,

 SUM(i_本级赚佣金额) AS  本级赚佣金额,

 SUM(i_本级盈亏) AS  本级盈亏,

 SUM(i_本级交上级) AS  本级交上级



FROM T_代理报表 A

   WHERE A.i_本级代理id=@userid

     AND (A.i_结单时间 between @startsj AND @endjs)

     GROUP BY

       A.i_本级代理id,

       A.i_下级代理id

 

 

 

select [语句执行花费时间(毫秒)]=datediff(ms,@d,getdate())

****************************************************

问题：

当我把【 (A.i_结单时间 between @startsj AND @endjs)】条件去掉，测试只要2.3秒

也就是说，只要加了【i_结单时间】字段查询，效率就慢了几十倍，但这个字段我是有加索引的。

如果说数据表太大导致慢也没道理，如果是数据量问题，应该没加这个条件会更慢

另外我这个表几乎每秒钟都在写入数据，不知道会不会跟这个有关系

...全文

4525 106 打赏收藏转发到动态举报

写回复

用AI写文章

106 条回复

切换为时间正序

请发表友善的回复…

发表回复

發糞塗牆 2014-05-26

打赏
举报

insert 是自动提交事务，即使你没有放在begin tran里面，它自己也会成为一个事务，而且insert要申请的锁比较高级，具体看表结构和insert语句等等。提交了事务，insert才算有效，索引才会开始维护。不过这一过程往往都很快，你可能感觉不出来，维护B-Tree的速度会比单纯的插入快

rd16 2014-05-25

打赏
举报

引用 100 楼 zqtsx 的回复:

你需要符合索引，独立索引起步到作用几乎，因为后面用到了group by A.i_本级代理+A.i_结单时间+A.i_本级代理id+A.i_下级代理id组合的符合索引，注意顺序要跟 where 后面的查询字段的顺序一致，如果需要按照id排序，还需要在末尾不上ID字段的索引，我这里只是举个例子，不代表可以直接实用于你的情况，具体还要自己根据实际索引使用频繁度进行组合/复合索引的建设具体可以关于复合索引的优化案例可以参照下这个 http://blog.csdn.net/zqtsx/article/details/8929625

“注意顺序要跟 where 后面的查询字段的顺序一致” <-------------兄台，这个能详细说明一下吗？你的文章我看了，写得非常棒，MYSQL分页似乎比MSSQL方便很多啊。。。。。

rd16 2014-05-25

打赏
举报

引用 104 楼 DBA_Huangzj 的回复:

insert要看你的事务，如果insert所在的事务结束了就开始创建维护索引，至于统计信息，假设你有1亿的数据，只insert个100条，是不会更新的，关系数据库的瓶颈通常是在插入，而不是在查询，但是第三范式有利于插入，不过对查询相对不利。如果null很多，可以用filter index，

“insert所在的事务”<----这个不太理解不知道你说的事物是不是 Begin Tran，我没有用到这个脚本。现在表内数据现在一千万左右，有时候每秒同时insert 10-20条。不知道insert完之后是不是马上生成索引？？

發糞塗牆 2014-05-25

打赏
举报

insert要看你的事务，如果insert所在的事务结束了就开始创建维护索引，至于统计信息，假设你有1亿的数据，只insert个100条，是不会更新的，关系数据库的瓶颈通常是在插入，而不是在查询，但是第三范式有利于插入，不过对查询相对不利。如果null很多，可以用filter index，

rd16 2014-05-25

打赏
举报

引用 78 楼 DBA_Huangzj 的回复:

尽量搞大的数据量再优化查询

版主，再请教一个问题。我的表每秒钟都在insert数据（频繁的时候有可能一秒钟同时插入几十条数据），那么MSSQL是不是insert完之后就马上生成索引？还是有可能insert完之后，可能要等N秒才能生成索引。注：我的个表只是insert很频繁，没有update和delete操作。如果换成你来设计这个表，不知道有没有要注意的地方。比如我的字段是允许NULL的，实际上字段里是没有NULL的，我是不是要在WHERE加上 is not null 会更好。

摘取天上星 2014-05-22

打赏
举报

内存大了就加内存啊~，不过索引失效目测也会影响到内存问题的~

摘取天上星 2014-05-22

打赏
举报

你需要符合索引，独立索引起步到作用几乎，因为后面用到了group by A.i_本级代理+A.i_结单时间+A.i_本级代理id+A.i_下级代理id组合的符合索引，注意顺序要跟 where 后面的查询字段的顺序一致，如果需要按照id排序，还需要在末尾不上ID字段的索引，我这里只是举个例子，不代表可以直接实用于你的情况，具体还要自己根据实际索引使用频繁度进行组合/复合索引的建设具体可以关于复合索引的优化案例可以参照下这个 http://blog.csdn.net/zqtsx/article/details/8929625

woshizhaoxuhui 2014-05-20

打赏
举报

学习一下。。

發糞塗牆 2014-05-20

打赏
举报

如果高版本的SQL Server，比如2008，对null有额外处理，问题不是很大，是否允许为null要看业务和系统设计，不能单纯看性能。is null 比is not null是否高效，也要看对应的比例，如果null 占比例少，is null也还是比较有效。另外对于null比较多的列，可以考虑用filter index，有人称过滤索引，有人称筛选索引，不过都不重要，就那么一个意思，创建索引的时候可以加where条件过滤掉

rd16 2014-05-19

打赏
举报

引用 78 楼 DBA_Huangzj 的回复:

尽量搞大的数据量再优化查询

大牛，现在速度一直保持在10秒以下，比以前的稳定多了。目前有个顾虑我创建列的时候，用的都是允许NULL，如： [i_结单时间] [datetime] NULL 允许NULL会不会影响性能，是不是改成 [i_结单时间] [datetime] NOT NULL 会更好

xiaoxiangqing 2014-05-19

打赏
举报

是没有用到索引导致的

YaMaHaHa01 2014-05-18

打赏
举报

SELECT 下级代理名=(select top 1 i_用户名 FROM T_会员 WHERE i_用户id=A.i_下级代理id), 下级占成金额=(select SUM(i_本级占成所得) FROM T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs), 下级退佣金额=(select SUM(i_本级退佣金额) FROM T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs), 下级赚佣金额=(select SUM(i_本级赚佣金额) FROM T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs), 下级盈亏=(select SUM(i_本级盈亏) FROM T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs), 本级交上级=(select SUM(i_本级交上级) FROM T_代理报表 WHERE i_本级代理id=A.i_下级代理id AND i_结单时间 between @startsj AND @endjs), SUM(i_会员购买金额) AS 会员购买金额, SUM(i_本级占成所得) AS 本级占成所得, SUM(i_本级退佣金额) AS 本级退佣金额, SUM(i_本级赚佣金额) AS 本级赚佣金额, SUM(i_本级盈亏) AS 本级盈亏, SUM(i_本级交上级) AS 本级交上级 FROM T_代理报表 A WHERE A.i_本级代理id=@userid AND (A.i_结单时间 between @startsj AND @endjs) GROUP BY A.i_本级代理id, A.i_下级代理id 先简化语句吧。同样条件5次查询，咋能不慢。

在路上_- 2014-05-17

打赏
举报

期待进一步的测试结果……

在路上_- 2014-05-17

打赏
举报

学习…… 版主，把这贴加精吧

waiwlq 2014-05-17

打赏
举报

内存么朋友啊？

lg314 2014-05-16

打赏
举报

CREATE INDEX IX_i_T_代理报表_结单时间_i_本级代理 ON T_代理报表 (i_结单时间,i_本级代理id,i_下级代理id) 
INCLUDE (i_本级占成所得,i_本级退佣金额,i_本级赚佣金额,i_本级盈亏,i_本级交上级)

还有创建这个索引，这个数据量单纯的给结单时间加索引没有意义

lg314 2014-05-16

打赏
举报

SELECT  下级代理名 = (
                  SELECT TOP 1 i_用户名 FROM T_会员 WHERE i_用户id = A.i_下级代理id
                )
      , SUM(app.下级占成金额)AS 下级占成金额
      , SUM(app.下级退佣金额)AS 下级退佣金额
      , SUM(app.下级赚佣金额)AS 下级赚佣金额
      , SUM(app.下级盈亏)AS 下级盈亏
      , SUM(app.下级交上级)AS 本级交上级
      , SUM(i_本级占成所得) AS 本级占成所得
      , SUM(i_本级退佣金额) AS 本级退佣金额
      , SUM(i_本级赚佣金额) AS 本级赚佣金额
      , SUM(i_本级盈亏) AS 本级盈亏
      , SUM(i_本级交上级) AS 本级交上级
FROM    T_代理报表 A JOIN (
              SELECT  i_本级代理id
					  , SUM(i_本级占成所得) AS 下级占成金额
                      , SUM(i_本级退佣金额) AS 下级退佣金额
                      , SUM(i_本级赚佣金额) AS 下级赚佣金额
                      , SUM(i_本级盈亏) AS 下级盈亏
                      , SUM(i_本级交上级) AS 下级交上级
              FROM      T_代理报表
              WHERE   i_结单时间 BETWEEN @startsj AND @endjs
              GROUP BY i_本级代理id
            ) app
        ON A.i_下级代理id=app.i_本级代理id
WHERE   A.i_本级代理id = @userid
        AND ( A.i_结单时间 BETWEEN @startsj AND @endjs )
GROUP BY A.i_本级代理id, A.i_下级代理id

这样呢？

rd16 2014-05-16

打赏
举报

引用 85 楼 lg314 的回复:

CREATE INDEX IX_i_T_代理报表_结单时间_i_本级代理 ON T_代理报表 (i_结单时间,i_本级代理id,i_下级代理id) 
INCLUDE (i_本级占成所得,i_本级退佣金额,i_本级赚佣金额,i_本级盈亏,i_本级交上级)

还有创建这个索引，这个数据量单纯的给结单时间加索引没有意义

兄台有何高见？把时间列改为数字类型？改成 yyyymmddhhmm数字类型会不会更快？

rd16 2014-05-16

打赏
举报

引用 84 楼 lg314 的回复:

SELECT  下级代理名 = (
                  SELECT TOP 1 i_用户名 FROM T_会员 WHERE i_用户id = A.i_下级代理id
                )
      , SUM(app.下级占成金额)AS 下级占成金额
      , SUM(app.下级退佣金额)AS 下级退佣金额
      , SUM(app.下级赚佣金额)AS 下级赚佣金额
      , SUM(app.下级盈亏)AS 下级盈亏
      , SUM(app.下级交上级)AS 本级交上级
      , SUM(i_本级占成所得) AS 本级占成所得
      , SUM(i_本级退佣金额) AS 本级退佣金额
      , SUM(i_本级赚佣金额) AS 本级赚佣金额
      , SUM(i_本级盈亏) AS 本级盈亏
      , SUM(i_本级交上级) AS 本级交上级
FROM    T_代理报表 A JOIN (
              SELECT  i_本级代理id
					  , SUM(i_本级占成所得) AS 下级占成金额
                      , SUM(i_本级退佣金额) AS 下级退佣金额
                      , SUM(i_本级赚佣金额) AS 下级赚佣金额
                      , SUM(i_本级盈亏) AS 下级盈亏
                      , SUM(i_本级交上级) AS 下级交上级
              FROM      T_代理报表
              WHERE   i_结单时间 BETWEEN @startsj AND @endjs
              GROUP BY i_本级代理id
            ) app
        ON A.i_下级代理id=app.i_本级代理id
WHERE   A.i_本级代理id = @userid
        AND ( A.i_结单时间 BETWEEN @startsj AND @endjs )
GROUP BY A.i_本级代理id, A.i_下级代理id

这样呢？

SQL Server 执行时间: CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。 SQL Server 执行时间: CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。 SQL Server 执行时间: CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。 (12 行受影响) 表 'T_代理报表'。扫描计数 50，逻辑读取 89730 次，物理读取 2067 次，预读 61412 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。表 'T_会员'。扫描计数 0，逻辑读取 24 次，物理读取 9 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。 SQL Server 执行时间: CPU 时间 = 11149 毫秒，占用时间 = 13573 毫秒。 ==================================================== 第二次 (12 行受影响) 表 'T_代理报表'。扫描计数 50，逻辑读取 90155 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。表 'T_会员'。扫描计数 0，逻辑读取 24 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。 SQL Server 执行时间: CPU 时间 = 14586 毫秒，占用时间 = 5380 毫秒。