2,3个字段的表，数据量大了，需要分表吗？

领域专家: 后端开发技术领域

2018-03-30 10:57:34

具体业务是这样的，一个用户表，字段有：
id, name, phone, sex, age……

实际业务中，经常根据 id 或 phone 查找，数据量小的时候，单表就ok了，phone建个索引完事。

但是用户表越来越大，已经几千万了，考虑到后续的发展，已经按id mod 10，进行了分表操作，
同时加了一个映射表，只有2个字段， phone => id,

那么这个映射表，是否有必要分表呢？如果记录表过亿了，会不会存在性能问题？

...全文

905 6 打赏收藏转发到动态举报

写回复

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

qq_36802756 2018-04-02

打赏
举报

回复

之前搞过一个，每天生成一个新表，只记录当天的数据

游北亮 2018-03-31

打赏
举报

回复

引用 4 楼 alex259 的回复:

我觉得如果一直是需要保留的数据，那么可以用号码段来分表，根据输入的phone号码来判断，需要去哪个表查，对应的数据。如果后面数据量再大了，就根据号码位数再细分。不知道是不是可行

如果只是根据phone查，你这个设计当然没问题，但是如果根据id来查，怎么知道在哪个表？所以映射表还是需要的

alex259 2018-03-31

打赏
举报

回复

我觉得如果一直是需要保留的数据，那么可以用号码段来分表，根据输入的phone号码来判断，需要去哪个表查，对应的数据。如果后面数据量再大了，就根据号码位数再细分。不知道是不是可行

游北亮 2018-03-30

打赏
举报

回复

前端已经通过Redis做了一级缓存，所以本问题，只是纯粹的想了解下，这个字段很少的表，是否有必要分表？不分表的话，单表膨胀是否会存在性能问题？

游北亮 2018-03-30

打赏
举报

回复

引用 2 楼 rucypli 的回复:

直接分mod100个表

谢谢，我的问题是那个映射表，只有2个字段，需要分表吗？

rucypli 2018-03-30

打赏
举报

回复

直接分mod100个表

也可以，根据数据冷热程度拆分，20%的热点字段拆到一个表，80%的冷字段拆到另外一个表。insert into t_order(user_id,order_id) values(2,3)，user_id%2 = 0使用数据源ds0，order_id%2 = 1使用t_order1，insert语句最终操作的是数据源ds0的t_order1表。对1000w的用户数据进行分库分表，对用户表的数据进行分表和分库的操作。分库分表的目的，是将一个表拆成N个表，就是让每个表的数据量控制在一定范围内，保证SQL的性能。

随着近些年信息化大跃进，各行各业无纸化办公产生了大量的数据，而越来越多的数据存入了数据库中。当使用 MySQL 数据库的时候，单表超出了 2000 万数据量就会出现性能上的分水岭。并且物理服务器的 CPU、内存、存储、连接数等资源有限，某个时段大量连接同时执行操作，会导致数据库在处理上遇到性能瓶颈。

postgres的hash分表不停机扩容方案原来我们hash分表之后，数据扩容采用的是rehash，这样迁移全部的数据，比较麻烦。本次扩容利用hash环原理，并在此基础上做一些适应性的改动。首先假定哈希环的范围为0-1023，总共1024的数字，这个可以根据项目情况扩大或者减小。然后假定表"test"中有一个字段"test_col"，我们根据这一个字段进行分表，因为hash环的范围是0-1023，...

点击上方“Java精选”，选择“设为星标”别问别人为什么，多问自己凭什么！下方有惊喜，留言必回，有问必答！每天08:15更新文章，每天进步一点点...当业务数据达到一定量级(比如：my...

一种可以避免数据迁移的分库分表scale-out扩容模式一种可以避免数据迁移的分库分表scale-out扩容方式目前绝大多数应用采取的两种分库分表规则 mod方式 dayofweek系列日期方式（所有星期1的数据在一个库/表,或所有?月份的数据在一个库表）这两种方式有个本质的特点，就是离散性加周期性。例如以一个表的主键对3取余数的方式分库或分表：那么随着数据量的增大，每个...

57,064

社区成员

56,762

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章