mysql 600W数据分组查询

cfd406635982 2013-04-27 04:24:30



--数据库mysql 5.X



--创建表的语句

CREATE TABLE TABLE_A (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `logtime` datetime DEFAULT NULL ,

  `isFirst` int(11) NOT NULL DEFAULT '0' COMMENT '只有0/1',

  `name` varchar(15) DEFAULT NULL,

  `uid` varchar(100) DEFAULT NULL,

  `sended` int(11) NOT NULL DEFAULT '0' COMMENT '只有0/1',

  PRIMARY KEY (`id`),

  KEY `logtime` (`logtime`)

) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT;

--数据 太多了。模拟给一条吧。

INSERT INTO `table_a` VALUES (1,'2013-04-27 01:02:03',0,'jack','13243423',0);



-- 查询语句

SELECT uid, count(*) as count, name, GROUP_CONCAT(id) FROM TABLE_A 

WHERE (isFirst=0 and sended=0) and LEFT(logtime, 7)='2013-04'

GROUP BY uid HAVING  count >= 15

 limit 0,10000;

这个表的数据量大约600--800W
如果不分页的话，基本上每次查询出来的结果在10-20W行左右，
由于是分组，每个分组的数量大概在5-60条记录吧，所以关联的记录大概在100W左右。
数据需要查询出来再处理，几十万一次加载到内存太多了，所以分页。
但是效率特别低，其中有一个GROUP_CONCAT(id) 这个也比较影响性能。
但是我需要知道每次分组后的ID，以便更新值。
其中isFirst 和 sended 只有0和1 两个值。

=======
有什么好的办法吗？

...全文

282 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

ACMAIN_CHM 2013-04-28

打赏
举报

回复

create index xx on TABLE_A(isFirst,sended,uid,logtime); SELECT uid, count(*) as count, name, GROUP_CONCAT(id) FROM TABLE_A WHERE (isFirst=0 and sended=0) and logtime between '2013-04-01' and '2013-04-30 23:59:59' GROUP BY uid HAVING count(*) >= 15 limit 0,10000;

wwwwb 2013-04-28

打赏
举报

回复

LEFT(logtime, 7)='2013-04'：无法用到索引最好logtime用日期型

rucypli 2013-04-27

打赏
举报

回复

LEFT(logtime, 7)='2013-04‘ 这句改成 logtime >'2013-04' and logtime <'2013-05'

cfd406635982 2013-04-27

打赏
举报

回复

大哥些。。没人回答吗？。。

1. mysql 的数据查询 , 大小字段要分开 , 这个还是有必要的 , 除非一点就是你查询的都是索引内容而不是表内容 , 比如只查询 id 等等 2. 查询速度和索引有很大关系也就是索引的大小直接影响你的查询效果 , 但是查询条件一定要建立索引 , 这点上注意的是索引字1.mysql的数据查询,大小字段要分开,这个还是有必要的,除非一点就是你查询的都是索引内容而不是表内容,比如只查询id等等2...

查询重复的字段需要创建索引，多个条件则创建组合索引，各个条件的索引都存在则不必须创建组合索引有些情况直接使用GROUP BY HAVING则能直接解决；但是有些情况下查询缓慢，则需要使用下面其他的方法以下是本人整理出来的查询重复数据的SQL，适用于千万级数据量的MYSQL数据库。1.适用于整数类型的SELECT DISTINCT UId FROM vehicle WHERE 1=1 GROUP B...

mysql按月份分组查询的方法：根据format字符串格式化date值，语法为【DATE_FORMAT(date,format)】，其中【%M 】为月的名字。mysql按月份分组查询的方法：select DATE_FORMAT(createtime,'%Y-%m'),count(*) from test where user =8 group by DATE_FORMAT(createtime,'...

MySQL对数据表进行分组查询(GROUP BY)GROUP BY关键字可以将查询结果按照某个字段或多个字段进行分组。字段中值相等的为一组。基本的语法格式如下：GROUP BY 属性名 [HAVING 条件表达式] [WITH ROLLUP]属性名：是指按照该字段的值进行分组。HAVING 条件表达式：用来限制分组后的显示，符合条件表达式的结果将被显示。WITH ROLLUP：将会在所有记录的最后...

一：问题时间范围查询所有数据的同数据存在超过4次的数据，检索查询时已经没有速度了，直接不响应。优化方向：①给md5_code、nuclear_time字段加索引。②给sql语句后面加order by null。③调整where条件里字段的查询顺序，有索引的放前面。④给所有where条件的字段加组合索引。⑤用子查询的方式，先查where条件里的内容，再去重。 SQL分析后的结果是：可能用到索引：nu...

57,063

社区成员

56,762

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章