Mysql 大数据量查询如何优化(当前数据仅有80万已很慢)

iiitom 2010-07-25 01:37:00
仅仅做一个 count 查询, 带一个 where xx = xxxx 的条件,

已经很慢。

有什么好办法优化Mysql的查询,

目前表未加任何索引。
...全文
10591 22 打赏 收藏 转发到动态 举报
写回复
用AI写文章
22 条回复
切换为时间正序
请发表友善的回复…
发表回复
whinyko 2012-03-31
  • 打赏
  • 举报
回复
你使用了mysql cluster了吗?公司有过例子,数据上1,000万,select的速度是比较慢的!
iiitom 2010-08-04
  • 打赏
  • 举报
回复
看到楼上诸位回答,有一定启示

当前,数据量不算大的情况下,瓶颈还在于硬件计算能力。
lxy2gy 2010-08-03
  • 打赏
  • 举报
回复
嗯,几百万的数据量,加索引就足够了
fnzh001 2010-08-01
  • 打赏
  • 举报
回复
我的数据库也有这个问题
gates_gp 2010-07-31
  • 打赏
  • 举报
回复
不知道大家是否听说过mysql partition table的一个比较严重的bug, 可能会导致数据丢失.
建议先不要急着用partition table, 不要说300万, 就是3000万我觉得应当不会有问题.
先在索引上下点功夫试试, 实在不行了再把结果发出来, 大家帮忙调调
kyzy_yy_pm 2010-07-29
  • 打赏
  • 举报
回复
读写分离
ljf_ljf 2010-07-28
  • 打赏
  • 举报
回复
还是要看 XX 字段是什么类型... BLOB 和 Text 之类即使你增加了索引,效果也不是很理想的.
筛选 XX 字段尽量使用数字类型.

另外:
[Quote=引用 12 楼 iiitom 的回复:]

写的速度我不在意,

只在意读的速度,还请指教。

数据量在 300万时如何应对。
[/Quote]

这个级别的数据量在分区基础上,进行分区查询可以减少系统比较多的资源.
feixianxxx 2010-07-28
  • 打赏
  • 举报
回复
你的字段类型都有些啥啊。。
BLOB和TEXT之类的字段可以分离开标 ~
iiitom 2010-07-28
  • 打赏
  • 举报
回复
写的速度我不在意,

只在意读的速度,还请指教。

数据量在 300万时如何应对。
aliyiyi 2010-07-28
  • 打赏
  • 举报
回复
看一下你的业务是读多吧!真有数据量很大时,可以读写分离。还可以放到innodb中,把缓存开大!
wwwwb 2010-07-27
  • 打赏
  • 举报
回复
一般是加索引、分区表、分表(减少单表记录数),你的表字段有多少
rucypli 2010-07-27
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 iiitom 的回复:]
报告1:
目前对80万数据,加索引,速度提高明显。
[/Quote]
够了
linscooter 2010-07-27
  • 打赏
  • 举报
回复
好文,好仔细。
widewave 2010-07-27
  • 打赏
  • 举报
回复
对xx加索引吧,80万数据,简单SQL语句不应该那么慢的。
iiitom 2010-07-27
  • 打赏
  • 举报
回复
表字段7、8个
iiitom 2010-07-26
  • 打赏
  • 举报
回复
好文,

请大虾们继续。
ACMAIN_CHM 2010-07-25
  • 打赏
  • 举报
回复
[Quote]分区表,这个是怎样的操作手法,麻烦讲讲。
[/Quote]

MySQL官方文档 http://dev.mysql.com/doc/refman/5.1/zh/index.html

[Quote]第18章:分区
目录

18.1. MySQL中的分区概述
18.2. 分区类型
18.2.1. RANGE分区
18.2.2. LIST分区
18.2.3. HASH分区
18.2.4. KEY分区
18.2.5. 子分区
18.2.6. MySQL分区处理NULL值的方式
18.3. 分区管理
18.3.1. RANGE和LIST分区的管理
18.3.2. HASH和KEY分区的管理
18.3.3. 分区维护
18.3.4. 获取关于分区的信息
本章讨论MySQL 5.1.中实现的分区。关于分区和分区概念的介绍可以在18.1节,“MySQL中的分区概述”中找到。MySQL 5.1 支持哪几种类型的分区,在18.2节,“分区类型” 中讨论。关于子分区在18.2.5节,“子分区” 中讨论。现有分区表中分区的增加、删除和修改的方法在18.3节,“分区管理” 中介绍。 和分区表一同使用的表维护命令在18.3.3节,“分区维护” 中介绍。

请注意:MySQL 5.1中的分区实现仍然很新(pre-alpha品质),此时还不是可生产的(not production-ready)。 同样,许多也适用于本章:在这里描述的一些功能还没有实际上实现(分区维护和重新分区命令),其他的可能还没有完全如所描述的那样实现(例如, 用于分区的数据目录(DATA DIRECTORY)和索引目录(INDEX DIRECTORY)选项受到Bug #13520) 不利的影响). 我们已经设法在本章中标出这些差异。在提出缺陷报告前,我们鼓励参考下面的一些资源:

MySQL 分区论坛

这是一个为对MySQL分区技术感兴趣或用MySQL分区技术做试验提供的官方讨论论坛。来自MySQL 的开发者和其他的人,会在上面发表和更新有关的材料。它由分区开发和文献团队的成员负责监控。

分区缺陷报告

已经归档在缺陷系统中的、所有分区缺陷的一个列表,而无论这些缺陷的年限、严重性或当前的状态如何。根据许多规则可以对这些缺陷进行筛选,或者可以从MySQL缺陷系统主页开始,然后查找你特别感兴趣的缺陷。

Mikael Ronström's Blog

MySQL分区体系结构和领先的开发者Mikael Ronström 经常在这里贴关于他研究MySQL 分区和MySQL簇的文章。

PlanetMySQL

一个MySQL 新闻网站,它以汇集MySQL相关的网誌为特点,那些使用我的MySQL的人应该对此有兴趣。我们鼓励查看那些研究MySQL分区的人的网誌链接,或者把你自己的网誌加到这些新闻报道中。

MySQL 5.1的二进制版本目前还不可用;但是,可以从BitKeeper知识库中获得源码。要激活分区,需要使用--with-分区选项编译服务器。关于建立MySQL 的更多信息,请参见2.8节,“使用源码分发版安装MySQL”。如果在编译一个激活分区的MySQL 5.1创建中碰到问题,可以在MySQL分区论坛中查找解决办法,如果在论坛中已经贴出的文章中没有找到问题的解决办法,可以在上面寻找帮助。

18.1. MySQL中的分区概述
本节提供了关于MySQL 5.1.分区在概念上的概述。

SQL标准在数据存储的物理方面没有提供太多的指南。SQL语言的使用独立于它所使用的任何数据结构或图表、表、行或列下的介质。但是,大部分高级数据库管理系统已经开发了一些根据文件系统、硬件或者这两者来确定将要用于存储特定数据块物理位置的方法。在MySQL中,InnoDB存储引擎长期支持表空间的概念,并且MySQL服务器甚至在分区引入之前,就能配置为存储不同的数据库使用不同的物理路径(关于如何配置的解释,请参见7.6.1节,“使用符号链接”)。

分区又把这个概念推进了一步,它允许根据可以设置为任意大小的规则,跨文件系统分配单个表的多个部分。实际上,表的不同部分在不同的位置被存储为单独的表。用户所选择的、实现数据分割的规则被称为分区函数,这在MySQL中它可以是模数,或者是简单的匹配一个连续的数值区间或数值列表,或者是一个内部HASH函数,或一个线性HASH函数。函数根据用户指定的分区类型来选择,把用户提供的表达式的值作为参数。该表达式可以是一个整数列值,或一个作用在一个或多个列值上并返回一个整数的函数。这个表达式的值传递给分区函数,分区函数返回一个表示那个特定记录应该保存在哪个分区的序号。这个函数不能是常数,也不能是任意数。它不能包含任何查询,但是实际上可以使用MySQL 中任何可用的SQL表达式,只要该表达式返回一个小于MAXVALUE(最大可能的正整数)的正数值。分区函数的例子可以在本章后面关于分区类型的讨论中找到 (请参见18.2节,“分区类型” ),也可在13.1.5节,“CREATE TABLE语法”的分区语法描述中找到。

当二进制码变成可用时(也就是说,5.1 -max 二进制码将通过--with-partition 建立),分区支持就将包含在MySQL 5.1的-max 版本中。如果MySQL二进制码是使用分区支持建立的,那么激活它不需要任何其他的东西 (例如,在my.cnf 文件中,不需要特殊的条目)。可以通过使用SHOW VARIABLES命令来确定MySQL是否支持分区,例如:

mysql> SHOW VARIABLES LIKE '%partition%';

+-----------------------+-------+
| Variable_name | Value |
+-----------------------+-------+
| have_partition_engine | YES |
+-----------------------+-------+
1 row in set (0.00 sec)
在如上列出的一个正确的SHOW VARIABLES 命令所产生的输出中,如果没有看到变量have_partition_engine的值为YES,那么MySQL的版本就不支持分区。(注意:在显示任何有关分区支持信息的命令SHOW ENGINES的输出中,不会给出任何信息;必须使用SHOW VARIABLES命令来做出这个判断)。

对于创建了分区的表,可以使用你的MySQL 服务器所支持的任何存储引擎;MySQL 分区引擎在一个单独的层中运行,并且可以和任何这样的层进行相互作用。在MySQL 5.1版中,同一个分区表的所有分区必须使用同一个存储引擎;例如,不能对一个分区使用MyISAM,而对另一个使用InnoDB。但是,这并不妨碍在同一个 MySQL 服务器中,甚至在同一个数据库中,对于不同的分区表使用不同的存储引擎。

要为某个分区表配置一个专门的存储引擎,必须且只能使用[STORAGE] ENGINE 选项,这如同为非分区表配置存储引擎一样。但是,必须记住[STORAGE] ENGINE(和其他的表选项)必须列在用在CREATE TABLE语句中的其他任何分区选项之前。下面的例子给出了怎样创建一个通过HASH分成6个分区、使用InnoDB存储引擎的表:

CREATE TABLE ti (id INT, amount DECIMAL(7,2), tr_date DATE)
ENGINE=INNODB
PARTITION BY HASH(MONTH(tr_date))
PARTITIONS 6;
(注释:每个PARTITION 子句可以包含一个 [STORAGE] ENGINE 选项,但是在MySQL 5.1版本中,这没有作用)。

创建分区的临时表也是可能的;但是,这种表的生命周期只有当前MySQL 的会话的时间那么长。对于非分区的临时表,这也是一样的。

注释:分区适用于一个表的所有数据和索引;不能只对数据分区而不对索引分区,反之亦然,同时也不能只对表的一部分进行分区。

可以通过使用用来创建分区表的CREATE TABLE语句的PARTITION子句的DATA DIRECTORY(数据路径)和INDEX DIRECTORY(索引路径)选项,为每个分区的数据和索引指定特定的路径。此外,MAX_ROWS和MIN_ROWS选项可以用来设定最大和最小的行数,它们可以各自保存在每个分区里。关于这些选项的更多信息,请参见18.3节,“分区管理”。注释:这个特殊的功能由于Bug #13250的原因,目前还不能实用。在第一个5.1二进制版本投入使用时,我们应该已经把这个问题解决了。

分区的一些优点包括:

· 与单个磁盘或文件系统分区相比,可以存储更多的数据。

· 对于那些已经失去保存意义的数据,通常可以通过删除与那些数据有关的分区,很容易地删除那些数据。相反地,在某些情况下,添加新数据的过程又可以通过为那些新数据专门增加一个新的分区,来很方便地实现。

通常和分区有关的其他优点包括下面列出的这些。MySQL 分区中的这些功能目前还没有实现,但是在我们的优先级列表中,具有高的优先级;我们希望在5.1的生产版本中,能包括这些功能。

· 一些查询可以得到极大的优化,这主要是借助于满足一个给定WHERE 语句的数据可以只保存在一个或多个分区内,这样在查找时就不用查找其他剩余的分区。因为分区可以在创建了分区表后进行修改,所以在第一次配置分区方案时还不曾这么做时,可以重新组织数据,来提高那些常用查询的效率。

· 涉及到例如SUM() 和 COUNT()这样聚合函数的查询,可以很容易地进行并行处理。这种查询的一个简单例子如 “SELECT salesperson_id, COUNT(orders) as order_total FROM sales GROUP BY salesperson_id;”。通过“并行”, 这意味着该查询可以在每个分区上同时进行,最终结果只需通过总计所有分区得到的结果。

· 通过跨多个磁盘来分散数据查询,来获得更大的查询吞吐量。

要经常检查本页和本章,因为它将随MySQL 5.1后续的分区进展而更新。

18.2. 分区类型
18.2.1. RANGE分区
18.2.2. LIST分区
18.2.3. HASH分区
18.2.4. KEY分区
18.2.5. 子分区
18.2.6. MySQL分区处理NULL值的方式
本节讨论在MySQL 5.1中可用的分区类型。这些类型包括:

· RANGE 分区:基于属于一个给定连续区间的列值,把多行分配给分区。参见18.2.1节,“RANGE分区”。

· LIST 分区:类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。参见18.2.2节,“LIST分区”。

· HASH分区:基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL 中有效的、产生非负整数值的任何表达式。参见18.2.3节,“HASH分区”。

· KEY 分区:类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL 服务器提供其自身的哈希函数。必须有一列或多列包含整数值。参见18.2.4节,“KEY分区”。

无论使用何种类型的分区,分区总是在创建时就自动的顺序编号,且从0开始记录,记住这一点非常重要。当有一新行插入到一个分区表中时,就是使用这些分区编号来识别正确的分区。例如,如果你的表使用4个分区,那么这些分区就编号为0, 1, 2, 和3。对于RANGE和LIST分区类型,确认每个分区编号都定义....
[/Quote]
iiitom 2010-07-25
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 acmain_chm 的回复:]
你的查询语句是什么? 直接贴出来原语句,

查询优化是针对某个SQL语句的,而不是针对表的。一般常用的方法有

1. 添加索引
2. 分区表
3. 添加冗余字段。
。。
[/Quote]

谢谢,目前的逻辑并不十分复杂,设计也尽量让查询不必关联查询。
索引,这步已经做了,效果显著。

不过,当数据量大时依然有慢的表现,那么,分区表,这个是怎样的操作手法,麻烦讲讲。
ACMAIN_CHM 2010-07-25
  • 打赏
  • 举报
回复
你的查询语句是什么? 直接贴出来原语句,

查询优化是针对某个SQL语句的,而不是针对表的。一般常用的方法有

1. 添加索引
2. 分区表
3. 添加冗余字段。
。。
iiitom 2010-07-25
  • 打赏
  • 举报
回复
报告1:
目前对80万数据,加索引,速度提高明显。

56,677

社区成员

发帖
与我相关
我的任务
社区描述
MySQL相关内容讨论专区
社区管理员
  • MySQL
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧