linux下的MYSQL大数据量插入慢的处理方法

jiangjungege6 2011-06-05 10:20:52

是这样的，我用的西部数码的VPS。但是我的采集数据，数据库非常大。大概有200多万条数据 2.7个G。现在插入数据非常慢。但是服务器总CPU只用到30%。怎么优化或设置，让CPU全速去处理数据，让插入数据的速度变快呢。
他们叫我直接租服务器，我觉得没必要呀。我是采集站，哪里受得起服务器呀。
各位有没有什么好的解决方案？

...全文

1028 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

低调de程序渣 2012-10-15

打赏
举报

楼主 laji

鼓手 2011-07-04

打赏
举报

贴出解决方法呗？谢谢！

jiangjungege6 2011-06-06

打赏
举报

谢谢大家。已解决。

lxq19851204 2011-06-06

打赏
举报

用INSERT DELAYED INTO 插入看看

ACMAIN_CHM 2011-06-06

打赏
举报

[Quote]但是服务器总CPU只用到30%。[/Quote] 这个就比较难了，需要分析一下瓶颈是在什么位置。一般可能是你的磁盘IO。如果这样的话，需要看一下你的表结构和数据库的物理设计了。

rucypli 2011-06-06

打赏
举报

set global innodb_flush_log_at_trx_commit=0;

jiangjungege6 2011-06-05

打赏
举报

我是用的DISCUZ哟。像你那样做，要改他们的源码吗？

zuoxingyu 2011-06-05

打赏
举报

7.2.16. INSERT语句的速度
插入一个记录需要的时间由下列因素组成，其中的数字表示大约比例：

连接：(3)
发送查询给服务器：(2)
分析查询：(2)
插入记录：（1x记录大小）
插入索引：（1x索引）
关闭：(1)
这不考虑打开表的初始开销，每个并发运行的查询打开。

表的大小以logN (B树)的速度减慢索引的插入。

加快插入的一些方法：

· 如果同时从同一个客户端插入很多行，使用含多个VALUE的INSERT语句同时插入几行。这比使用单行INSERT语句快(在某些情况下快几倍)。如果你正向一个非空表添加数据，可以调节bulk_insert_buffer_size变量，使数据插入更快。参见5.3.3节，“服务器系统变量”。

· 如果你从不同的客户端插入很多行，能通过INSERT DELAYED语句加快速度。参见13.2.4节，“INSERT语法”。

· 用MyISAM，如果在表中没有删除的行，能在SELECT语句正在运行的同时插入行。

· 当从一个文本文件装载一个表时，使用LOAD DATA INFILE。这通常比使用很多INSERT语句快20倍。参见13.2.5节，“LOAD DATA INFILE语法”。

· 当表有很多索引时，有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列过程：

有选择地用CREATE TABLE创建表。
执行FLUSH TABLES语句或命令mysqladmin flush-tables。
使用myisamchk --keys-used=0 -rq /path/to/db/tbl_name。这将从表中取消所有索引的使用。
用LOAD DATA INFILE把数据插入到表中，因为不更新任何索引，因此很快。
如果只想在以后读取表，使用myisampack压缩它。参见15.1.3.3节，“压缩表特性”。
用myisamchk -r -q /path/to/db/tbl_name重新创建索引。这将在写入磁盘前在内存中创建索引树，并且它更快，因为避免了大量磁盘搜索。结果索引树也被完美地平衡。
执行FLUSH TABLES语句或mysqladmin flush-tables命令。
请注意如果插入一个空MyISAM表，LOAD DATA INFILE也可以执行前面的优化；主要不同处是可以让myisamchk为创建索引分配更多的临时内存，比执行LOAD DATA INFILE语句时为服务器重新创建索引分配得要多。

也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk --keys-used=0 -rq /path/to/db/tbl_name，使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q /path/to/db/tbl_name。使用这种方式，还可以跳过FLUSH TABLES。

· 锁定表可以加速用多个语句执行的INSERT操作：

LOCK TABLES a WRITE;
INSERT INTO a VALUES (1,23),(2,34),(4,33);
INSERT INTO a VALUES (8,26),(6,29);
UNLOCK TABLES;
这样性能会提高，因为索引缓存区仅在所有INSERT语句完成后刷新到磁盘上一次。一般有多少INSERT语句即有多少索引缓存区刷新。如果能用一个语句插入所有的行，就不需要锁定。

对于事务表，应使用BEGIN和COMMIT代替LOCK TABLES来加快插入。

锁定也将降低多连接测试的整体时间，尽管因为它们等候锁定最大等待时间将上升。例如：

Connection 1 does 1000 inserts

Connections 2, 3, and 4 do 1 insert

Connection 5 does 1000 inserts

如果不使用锁定，2、3和4将在1和5前完成。如果使用锁定，2、3和4将可能不在1或5前完成，但是整体时间应该快大约40%。

INSERT、UPDATE和DELETE操作在MySQL中是很快的，通过为在一行中多于大约5次连续不断地插入或更新的操作加锁，可以获得更好的整体性能。如果在一行中进行多次插入，可以执行LOCK TABLES，随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。

INSERT装载数据比LOAD DATA INFILE要慢得多，即使是使用上述的策略。

· 为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度，通过增加key_buffer_size系统变量来扩大键高速缓冲区。参见7.5.2节，“调节服务器参数”。