社区
疑难问题
帖子详情
对数据库表上百万条的数据处理
chenyang80425
2010-06-13 05:11:48
我有一张表,大约有一千万条数据,每天我要对里面的一百万条左右的数据进行比对,更新数据状态.由于数据量太大,比对速度太慢.所以我考虑多台服务器同时运行进行比对.比如4台同时运行,电脑1运行:1到250000,电脑2运行:250000到500000,电脑3运行:500000到750000,电脑1运行:750000到1000000的数据.请问我要如何进行查询数据库了.让数据自动分配给每台服务器?
...全文
282
9
打赏
收藏
对数据库表上百万条的数据处理
我有一张表,大约有一千万条数据,每天我要对里面的一百万条左右的数据进行比对,更新数据状态.由于数据量太大,比对速度太慢.所以我考虑多台服务器同时运行进行比对.比如4台同时运行,电脑1运行:1到250000,电脑2运行:250000到500000,电脑3运行:500000到750000,电脑1运行:750000到1000000的数据.请问我要如何进行查询数据库了.让数据自动分配给每台服务器?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Q315054403
2010-06-14
打赏
举报
回复
分区需要良好的设计CPU、HDD。。。估计楼主功力还没到位
1000万数据并不算大
Rotel-刘志东
2010-06-14
打赏
举报
回复
同一台电脑做表分区了,把分区表放在不同磁盘分区上。
chenyang80425
2010-06-14
打赏
举报
回复
其实我这个速度慢是因为我在一个网站上抓取信息,把抓取的信息解析Html后,获得一个状态值,通过这个值更新数据库的相应记录。由于抓取速度慢。所以我考虑多台服务器抓取。但这样操作就会存在一个问题。几台服务器都同时去操作了同一条数据。造成性能无法提高。所以需要把表分成几个区,一台服务器记取一个分区的数据,这样就不会出现多台服务器对同一条记录进行操作的现象。
我用的sql server2000数据库,请问要如果进行表分区。
chenyang80425
2010-06-14
打赏
举报
回复
请问表如何进行分区?
--小F--
2010-06-13
打赏
举报
回复
4台电脑来做??还不如一台电脑来分区表 毕竟跨电脑远程操作不方便 而且效率不高
xiaoliaoyun
2010-06-13
打赏
举报
回复
还可以用表分区,不同的分区放不同的磁盘.
dawugui
2010-06-13
打赏
举报
回复
[Quote=引用楼主 chenyang80425 的回复:]
我有一张表,大约有一千万条数据,每天我要对里面的一百万条左右的数据进行比对,更新数据状态.由于数据量太大,比对速度太慢.所以我考虑多台服务器同时运行进行比对.比如4台同时运行,电脑1运行:1到250000,电脑2运行:250000到500000,电脑3运行:500000到750000,电脑1运行:750000到1000000的数据.请问我要如何进行查询数据库了.让数据自动分配给每台服务器?
[/Quote]
一千万条嘛,小意思啦.
对相关字段(你要用到的)加上索引,就能解决问题.
albert_sky
2010-06-13
打赏
举报
回复
一千万的数据用4台服务器,有点浪费了吧,你用的什么数据库?
albert_sky
2010-06-13
打赏
举报
回复
更新状态时表是否有其它用户使用,如果没有,可以用left join 生成新表, 这样比update快很多
Oracle
数据
库
大事务的
数据
更改对
数据
库
内部的影响
当用户执行一条SQL对
数据
库
进行更改操作的时候,我们知道
数据
是从磁盘读取到内存中进行更改操作的, 那么当这个SQL执行时间很长,而且修改
数据
量非常大,由于内存容量大小的原因,可能在事务没有commit 提交的情况...
当
数据
库
一张
表
中有百万条
数据
怎么办
问题: 后台有个定时任务,每5秒钟生成6条
数据
存储到
数据
库
中,那么一个月就会有 3110400 条
数据
存储到
数据
库
中。显然
数据
量达到了百万级,
数据
量越大后期的性能就开始下降。 解决: 手动为以后创建多张
表
,
表
名后面加上年月 yyyy_MM 为后缀。一个月用一张
表
。 在mybatis中使用sql语句对
数据
库
操作的时候,使用 ${} 拼接,而不是用 #{} 占位。 遗留问题: 目前不会用定时任务+存储过程去创建
表
是否有更高效优秀的办法解决
数据
量大的问题 ...
如何快速更新
数据
库
中的百万条
数据
环境:ubuntu 14.04,Mysql 5.6,python 2.7。 本文使用python的MySQLdb这个库,MySQL Python tutorial这个教程很赞。 MySQLDBdb
处理
INSERT、UPDATE、DELETE时需要显式得commit()才能使更新有效,这也意味着commit之前的更新语句是放在一个事务中的。 For databases th
java查询
数据
库
百万条
数据
,优化之:多线程+
数据
库
使用Spring boot在20秒内取完Mysql100万条
数据
每次需要从
数据
库
中查询100万条
数据
进行分析,不能用分页,请问怎么优化sql或者java代码呢?? 普通查询需要5分多分钟才查询完毕,所以我们用索引加多线程来实现。
php
处理
上百万条的
数据
库
如何提高
处理
查询速度(小白
数据
库
优化)
php
处理
上百万条的
数据
库
如何提高
处理
查询速度 1.对查询进行优化,应尽量避免全
表
扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全
表
扫描,如: select id from t where num is null 可以在num上设置默认值0,确保
表
疑难问题
22,210
社区成员
121,726
社区内容
发帖
与我相关
我的任务
疑难问题
MS-SQL Server 疑难问题
复制链接
扫一扫
分享
社区描述
MS-SQL Server 疑难问题
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章