【求助】MySQL 大数据分表思路千万级数据

用户昵称不能为空 2013-08-16 03:04:44

现有：用户账号表nick，购买记录表log；
需求：实时查询功能，通过表log.title 的模糊查询，得到表 nick的记录。表nick.uid=log.uid 对应关系。
分表：因为数据比较多 nick已经有9千万，log已经有300万数据；现在nick表查询起来就非常慢，log肯定会比nick更大，因为一个用户平均至少几个购买记录。

如果nick要分表如何分？
1）想到的是uid段来分，但是表nick中的uid不是连续的，中间有断的。而且uid跨越非常大，1到10亿，且不是连续。
2）如果nick分表，log估计也得分表。logo与nick都是多表，那么如何查询？（程序得改很多...）
如果这样分表，关键问题是nick 的uid值不是连续的，最小是有10以下，最大上亿。分得100万一个区间得无数个表，分得1亿一个区间表，跟不分表的效果没多大区别（发现MySQL一旦超过100万就开始慢了）。

表nick1、nick2、nick3、nick4是提供的数据



mysql> SELECT COUNT(uid),MIN(uid),MAX(uid) FROM nick1

    -> UNION SELECT COUNT(uid),MIN(uid),MAX(uid) FROM nick2

    -> UNION SELECT COUNT(uid),MIN(uid),MAX(uid) FROM nick3

    -> UNION SELECT COUNT(uid),MIN(uid),MAX(uid) FROM nick4;

+------------+----------+--------------+

| COUNT(uid) | MIN(uid) | MAX(uid)     |

+------------+----------+--------------+

|   38558758 |       31 | 133152982928 |

|   36101731 |        2 | 133153067302 |

|   12610937 |       87 | 133151412359 |

|     886706 |      533 |   1729210852 |

+------------+----------+--------------+

4 rows in set (1 min 14.58 sec)

这几个表都是nick这样的结构：



mysql> DESC nick;

+-----------+-------------+------+-----+---------+-------+

| Field     | Type        | Null | Key | Default | Extra |

+-----------+-------------+------+-----+---------+-------+

| uid       | bigint(20)  | NO   | PRI | NULL    |       |

| nick      | varchar(30) | NO   |     | NULL    |       |

+-----------+-------------+------+-----+---------+-------+

2 rows in set (0.02 sec)

有没有其他的方法或者更好的方法，求

...全文

374 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

用户昵称不能为空 2013-08-23

打赏
举报

引用 1 楼 rucypli 的回复:

模糊搜索肯定是不行的首要任务是做title的全文索引

我现在只需求简单查询分页列出，不需要模糊查询，但是需要分页。


mysql> SELECT MIN(uid),MAX(uid),COUNT(uid) FROM nick;
+----------+--------------+------------+
| MIN(uid) | MAX(uid)     | COUNT(uid) |
+----------+--------------+------------+
|        2 | 133153067302 |   88090625 |
+----------+--------------+------------+
1 row in set (0.00 sec)

分页用LIMIT，每页1000条，当达页数达到很大的时候，查询基本上死机，必须重启MYSQL ：


mysql> EXPLAIN
    -> SELECT * FROM nick ORDER BY uid ASC LIMIT 90000000,100;
+----+-------------+---------+------+---------------+------+---------+------+----------+----------------+
| id | select_type | table   | type | possible_keys | key  | key_len | ref  | rows     | Extra          |
+----+-------------+---------+------+---------------+------+---------+------+----------+----------------+
|  1 | SIMPLE      | nick    | ALL  | NULL          | NULL | NULL    | NULL | 88090625 | Using filesort |
+----+-------------+---------+------+---------------+------+---------+------+----------+----------------+
1 row in set (0.00 sec)

我现在用的方法是指定ID范围扫描，但是uid不是连续的，且nick表也在不停的增删纪录。


mysql> EXPLAIN
    -> SELECT * FROM nick WHERE uid>2010000 AND uid<2020000 ORDER BY uid ASC;

+----+-------------+---------+-------+---------------+---------+---------+------+------+-------------+
| id | select_type | table   | type  | possible_keys | key     | key_len | ref| rows | Extra       |
+----+-------------+---------+-------+---------------+---------+---------+------+------+-------------+
|  1 | SIMPLE      | nick    | range | PRIMARY       | PRIMARY | 8       | NULL|    1 | Using where |
+----+-------------+---------+-------+---------------+---------+---------+------+------+-------------+
1 row in set (0.00 sec)

用户昵称不能为空 2013-08-16