select count(*) from tb是否需要扫描全部的索引中间层？

nzperfect 2010-02-23 03:55:04

加精

表tb有聚集索引,有13个索引中间页.
那么在select count(*) from tb时，发现全走全部的索引中间层叶.

从理论上讲，由于每个数据页都记录着它的上一个page和下一个page,那么最小的io读取应该是:
读根页--->读最小的中间页--->读数据叶子---->依次往后读全部数据页.

但实际上却是读取全部的索引中间页，谁能解释一下？

附部分代码：



use tempdb

go

CREATE TABLE tmp (id int  ,c1 char(500),c2 char(500))

CREATE CLUSTERED INDEX CI_id ON tmp(id)

DECLARE @i INT

SET @i=0

WHILE @i<20129

BEGIN

    INSERT INTO tmp(id,c1,c2)

    SELECT @i,'a','z'

    SET @i=@i+1

END



set statistics io on

select COUNT(*) from tmp



DBCC IND(tempdb,tmp,-1)



dbcc traceon(3604)

dbcc page(tempdb,1,1666,3)

dbcc page(tempdb,1,196,3)

dbcc page(tempdb,1,193,3)

...全文

6450 169 打赏收藏转发到动态举报

写回复

用AI写文章

169 条回复

切换为时间正序

请发表友善的回复…

发表回复

lawbc 2010-03-06

打赏
举报

太深奥了，俺不懂啊，呵呵

zhangqiang0538 2010-03-06

打赏
举报

想想想想想想想想想想不出来

keyyi 2010-03-05

打赏
举报

高贴，mARK一下

回复内容回复内容太短了！

javazhou1988 2010-03-05

打赏
举报

来看看..............

liuhaifeng1976 2010-03-05

打赏
举报

dingdingdingding

时光审美 2010-03-04

打赏
举报

越来越深入了顶起学习。。。数据啊数据。

live360 2010-03-04

打赏
举报

lcw321321 2010-03-04

打赏
举报

mark,回复内容太短了

蛙易 2010-03-04

打赏
举报

学习了（它说我回复的内容太短了）

baisiye 2010-03-03

打赏
举报

很强大~~~~~~~~~~~~

wenboliang 2010-03-03

打赏
举报

看不懂是什么东西东方饭店的的的的

nzperfect 2010-03-02

打赏
举报

谢谢大家的讨论，暂时结了。

adnin2010 2010-03-02

打赏
举报

学习.

jwwyqs 2010-03-02

打赏
举报

学习
！！！！！！

Sybase数据库恢复 2010-03-02

打赏
举报

引用 153 楼 perfectaction 的回复:

我今天在想一个问题可以推翻之前的想法，并且可以解释count(*)的问题：

sql server 在读取索引数据层数据时，有可能是通过索引中间层读出符合条件的全部数据层的数据页pageid列表，然后通过这个列表去读数据页。而不是通过索引中间层找到其中一个数据页，通过该数据页中标记的nextpageid来读取下一个数据页。

预读机制并不是count(*)扫描全部索引层的最好解释，因为预读时，即使你只取一条数据，预读也可能是读全部的索引中间层及中部分数据页，因为sql server 总是尽可能的缓存数据表的数据以送减小io.这个可以通过
SQL codeDBCC DROPCLEANBUFFERS--无法清除tempdb的缓存数据.(所以不要使用tempdb库做测试)SELECT bd.*FROM sys.dm_os_buffer_descriptorsAS bdINNERJOIN
(SELECTobject_name(object_id)AS name
,index_id ,allocation_unit_idFROM sys.allocation_unitsAS auINNERJOIN sys.partitionsAS pON au.container_id= p.hobt_idAND (au.type=1OR au.type=3)UNIONALLSELECTobject_name(object_id)AS name
,index_id, allocation_unit_idFROM sys.allocation_unitsAS auINNERJOIN sys.partitionsAS pON au.container_id= p.partition_idAND au.type=2
)AS objON bd.allocation_unit_id= obj.allocation_unit_idWHERE database_id=db_id()and name='tbname'ORDERBY allocation_unit_id,page_type

通过执行此查询语句，可以发现执行select count(*) from tbname时，缓存全部的索引中间层和数据层，并未缓冲IAM页，所以不知count(*)时是否读取IAM页？另外，如查执行select * from tbname where id=1，可以发现预读机制可能会缓存全部索引中间层及差不多一半的数据层，但逻辑读只有3个page.

假设索引有3层。中间层和叶子层上的索引时分别单独自己串联起来的。中间层指向其所索引的第一个叶子层页面。
为了得到数据页面的页号信息，中间层的页面应该是最便捷的（长远来说，虽然目前你这个例子不是最好）。

另外，预读了不一定本次用。其他会话可能遇到高速缓存的预读数据。

对于sybase，我已经分析出来了索引的物理存储结构。请查看：http://blog.csdn.net/andkylee/archive/2010/03/01/5337013.aspx

Leshami 2010-03-02

打赏
举报

学习

回复内容太短了！

nzperfect 2010-03-02

打赏
举报

我今天在想一个问题可以推翻之前的想法，并且可以解释count(*)的问题：

sql server 在读取索引数据层数据时，有可能是通过索引中间层读出符合条件的全部数据层的数据页pageid列表，然后通过这个列表去读数据页。而不是通过索引中间层找到其中一个数据页，通过该数据页中标记的nextpageid来读取下一个数据页。

预读机制并不是count(*)扫描全部索引层的最好解释，因为预读时，即使你只取一条数据，预读也可能是读全部的索引中间层及中部分数据页，因为sql server 总是尽可能的缓存数据表的数据以送减小io.这个可以通过



DBCC DROPCLEANBUFFERS --无法清除tempdb的缓存数据.(所以不要使用tempdb库做测试)

SELECT bd.*

FROM sys.dm_os_buffer_descriptors AS bd

    INNER JOIN

    (

        SELECT object_name(object_id) AS name

            ,index_id ,allocation_unit_id

        FROM sys.allocation_units AS au

            INNER JOIN sys.partitions AS p

                ON au.container_id = p.hobt_id

                    AND (au.type = 1 OR au.type = 3)

        UNION ALL

        SELECT object_name(object_id) AS name 

            ,index_id, allocation_unit_id

        FROM sys.allocation_units AS au

            INNER JOIN sys.partitions AS p

                ON au.container_id = p.partition_id

                    AND au.type = 2

    ) AS obj

        ON bd.allocation_unit_id = obj.allocation_unit_id

WHERE database_id = db_id() and name='tbname'

ORDER BY allocation_unit_id,page_type

通过执行此查询语句，可以发现执行select count(*) from tbname时，缓存全部的索引中间层和数据层，并未缓冲IAM页，所以不知count(*)时是否读取IAM页？另外，如查执行select * from tbname where id=1，可以发现预读机制可能会缓存全部索引中间层及差不多一半的数据层，但逻辑读只有3个page.

wjlsmail 2010-03-02