复合索引的具体实现原理（数据结构）

weinanbu 2015-02-11 02:43:38

比如mysql 单列索引是将该列数据当做关键字构建一颗b+tree，但是组合索引是如何实现的呢?比如两个字段的组合索引，SELECT * FROM TABLE1 WHERE A=22 AND b=33 ; 是要建两棵树吗？如果只建立一颗树，那b列是如何存放的？

...全文

9330 16 打赏收藏转发到动态举报

写回复

用AI写文章

16 条回复

切换为时间正序

请发表友善的回复…

发表回复

猿人林克 2017-05-17

打赏
举报

引用 12 楼 xiwei_gao 的回复:

另，条件中的各个语句在顺序上，不会影响执行计划
select * from t where c1 = 100 and c2 = 100 
select * from t where c2 = 100 and c1 = 100

第二句不会用到复合索引吧？[/quote] 为何不走？你写sql的顺序并不影响执行计划，这两个sql完全等效。

jayxigua 2017-05-04

打赏
举报

引用 5 楼 benluobobo 的回复:

1 第二列也做了排序，首先根据第一列排序，在第一列一样的情况下，第二列再排序 2 一个查询只能使用一个索引，不存在你说的分别查找两棵树的情况

abcdefghiijklmnopqrs 2017-03-07

打赏
举报

引用 10 楼 weinanbu 的回复:

[quote=引用 9 楼 ACMAIN_CHM 的回复:] [quote=引用楼主 weinanbu 的回复:] 比如mysql 单列索引是将该列数据当做关键字构建一颗b+tree，但是组合索引是如何实现的呢?比如两个字段的组合索引，SELECT * FROM TABLE1 WHERE A=22 AND b=33 ; 是要建两棵树吗？如果只建立一颗树，那b列是如何存放的？

A=22 AND b=33 你假设一下 C=A*10000+B ,然后根据C做BTREE。后面的所以搜索一切就容易了。其实就是相同的原理。以A先放，A相同的情况下按B的顺序放。[/quote] 你的意思是将每一行的A、B值 hash成C,然后用C构建B-Tree ,当我在查询A=22 AND b=33 的时候，先将AB的值转成C=22*10000+33 ，之后再在B-tree里找c ，而c保存了A=22 AND b=33的数据的地址，是这个意思吗？如果是这样的话我觉得就不是先查找A列再查找b列了，我还是不太懂，

[/quote]楼主现在有结果了吗?正好看到这里也不懂.

同手同脚大步向前走 2017-02-04

打赏
举报

另，条件中的各个语句在顺序上，不会影响执行计划

select * from t where c1 = 100 and c2 = 100 
select * from t where c2 = 100 and c1 = 100

[/quote] 第二句不会用到复合索引吧？

卖水果的net 2015-02-12

打赏
举报

一个索引，创建一个树，也只能创建一个树，不管是单列，还是多列联合。如果是联合索引，第二列也会放在第一列后面。假定有一张表

create table t (c1 int , c2 int , c3 int , c4 int)

场景1

create index t_ix1 on t(c1) ;
create index t_ix2 on t(c2) ;

此时，你执行

select * from t where c1 = 100  -- 会用到 t_ix1 
select * from t where c2 = 100  -- 会用到 t_ix2 
select * from t where c1 = 100 and c2 = 100 -- 只能用到 t_ix1 和 t_ix2 中的一个。

场景2

create index t_ix1 on t(c1 ,c2)
create index t_ix2 on t(c2)

你再执行

select * from t where c1 = 100  -- 会用到 t_ix1 
select * from t where c2 = 100  -- 会用到 t_ix2 ,如果没有 t_ix2 ,就会全表扫描
select * from t where c1 = 100 and c2 = 100 -- 会用到 t_ix1

另，条件中的各个语句在顺序上，不会影响执行计划

select * from t where c1 = 100 and c2 = 100 
select * from t where c2 = 100 and c1 = 100

weinanbu 2015-02-12

打赏
举报

引用 9 楼 ACMAIN_CHM 的回复:

[quote=引用楼主 weinanbu 的回复:] 比如mysql 单列索引是将该列数据当做关键字构建一颗b+tree，但是组合索引是如何实现的呢?比如两个字段的组合索引，SELECT * FROM TABLE1 WHERE A=22 AND b=33 ; 是要建两棵树吗？如果只建立一颗树，那b列是如何存放的？

ACMAIN_CHM 2015-02-11

打赏
举报

引用楼主 weinanbu 的回复:

比如mysql 单列索引是将该列数据当做关键字构建一颗b+tree，但是组合索引是如何实现的呢?比如两个字段的组合索引，SELECT * FROM TABLE1 WHERE A=22 AND b=33 ; 是要建两棵树吗？如果只建立一颗树，那b列是如何存放的？

A=22 AND b=33 你假设一下 C=A*10000+B ,然后根据C做BTREE。后面的所以搜索一切就容易了。其实就是相同的原理。以A先放，A相同的情况下按B的顺序放。

九月茅 2015-02-11

打赏
举报

始终是一棵树的，只是构成树的叶子节点的数据从一列变成两列，而且叶子节点数也变多了。

benluobo 2015-02-11

打赏
举报

用哪个索引是查询器决定的也可以用force index强制使用索引

weinanbu 2015-02-11

打赏
举报

SELECT * FROM TABLE1 WHERE A=22 AND b=33 ; 也就是说我见了两个单列索引，只能用索引a？

benluobo 2015-02-11

打赏
举报

1 第二列也做了排序，首先根据第一列排序，在第一列一样的情况下，第二列再排序 2 一个查询只能使用一个索引，不存在你说的分别查找两棵树的情况

weinanbu 2015-02-11

打赏
举报

比如我想找（2,1）那么首先会找到第一列等于2 的那么找到了两个（2,1），（2,2），我想知道在找到第一列后，是如何找到第二列的，是一个一个找还是第二列也做了排序？怎么排的序？如果是建两个单列列索引，那就是分别查找两棵树，最后取rowid的交集是吗？我是小白，求解释的细一点，谢谢了

benluobo 2015-02-11

打赏
举报

如果要了解具体的存储方式，建议先了解一下数据存储格式，假设是innodb 执行如下语句 create table secondindextest(a int, b int); create index ix_a_b on secondindextest(a,b); insert into secondindextest select 1,1; insert into secondindextest select 1,2; insert into secondindextest select 2,1; insert into secondindextest select 2,2; 在来看看具体的数据是如何存储的 , 打开secondindextest.ibd文件，找到索引页，如下数据 80 00 00 01 80 00 00 01 00 00 01 57 8B 08 00 00 00 18 00 14 80 00 00 01 80 00 00 02 00 00 01 57 8B 09 00 00 00 20 00 14 80 00 00 02 80 00 00 01 00 00 01 57 8B 0A 00 00 00 28 FF B6 80 00 00 02 80 00 00 02 00 00 01 57 8B 0B 00 00 00 00 00 00 00 00 看其中的80 00 00 01 80 00 00 01 就是索引的第一行 1,1 ，这个80代表的是带符号的后面带的00 00 01 57 8B 08 00 00 00 18 00 14 包括了主键的位置以及下一行的偏移量等信息往后看，可以看到80 00 00 01 80 00 00 02 80 00 00 02 80 00 00 01 80 00 00 02 80 00 00 02 分别代表了(1,2) , (2,1) , (2,2) 你所问的存放问题实际上就是跟着第一列继续放

weinanbu 2015-02-11