社区
Java SE
帖子详情
关于JDBC读取大量数据
jessewizard
2011-11-27 03:48:30
当我用JDBC来从一个数据库读取N条数据(N很大,每条数据也很大,不定长),执行一些操作后,放入另一个库中。该怎么操作才能让效率最高?
存在问题是,每次读取的数据要尽量多,这样效率才会高,但是机器本身的内存是有限的,如果不做限制会超内存。
另外,机器可用的内存不等于,程序可以向JVM申请到的内存。
求高手指教。
...全文
701
8
打赏
收藏
关于JDBC读取大量数据
当我用JDBC来从一个数据库读取N条数据(N很大,每条数据也很大,不定长),执行一些操作后,放入另一个库中。该怎么操作才能让效率最高? 存在问题是,每次读取的数据要尽量多,这样效率才会高,但是机器本身的内存是有限的,如果不做限制会超内存。 另外,机器可用的内存不等于,程序可以向JVM申请到的内存。 求高手指教。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
tianye306
2011-12-02
打赏
举报
回复
学习了,和你一样
jessewizard
2011-12-02
打赏
举报
回复
[Quote=引用 4 楼 hehecafe 的回复:]
不知道下面的做法是否满足你的要求:
方案一:程序机制
1. 采用线程池来实现对数据进行并发处理,可根据内存的情况进行调整线程池最大并发线程数量
2. 从ResultSet中获取数据只能单线程,老老实实一行一行的取数据吧,每取到一行数据就交给线程池中的一个线程来进行处理
3. 线程池中的线程对数据处理完成后,为了不阻塞后面的请求,可将数据放入队列。然后等待后面的数据处理请求
4.……
[/Quote]
还有个问题是,程序要怎么知道jvm占的内存是多少呢。
showdance
2011-12-02
打赏
举报
回复
用Java实现这个功能没有太好的方法。
如果是查询表 插入到别的表,或者夸数据库,建议考虑用存储过程来做。这一容易提高效率。
lizhongyi188
2011-11-30
打赏
举报
回复
[Quote=引用 4 楼 hehecafe 的回复:]
不知道下面的做法是否满足你的要求:
方案一:程序机制
1. 采用线程池来实现对数据进行并发处理,可根据内存的情况进行调整线程池最大并发线程数量
2. 从ResultSet中获取数据只能单线程,老老实实一行一行的取数据吧,每取到一行数据就交给线程池中的一个线程来进行处理
3. 线程池中的线程对数据处理完成后,为了不阻塞后面的请求,可将数据放入队列。然后等待后面的数据处理请求
4.……
[/Quote]
楼上的方式值的试一下!
hehecafe
2011-11-30
打赏
举报
回复
不知道下面的做法是否满足你的要求:
方案一:程序机制
1. 采用线程池来实现对数据进行并发处理,可根据内存的情况进行调整线程池最大并发线程数量
2. 从ResultSet中获取数据只能单线程,老老实实一行一行的取数据吧,每取到一行数据就交给线程池中的一个线程来进行处理
3. 线程池中的线程对数据处理完成后,为了不阻塞后面的请求,可将数据放入队列。然后等待后面的数据处理请求
4. 写入另外一个库的工作也开启一个线程,轮询前面的队列中的数据,可一次从队列中拿一批数据,对这批数据的insert也只能老老实实一条条执行,对这批数据的insert开启事务可提高速度
方案二:采用临时表机制
如果数据量巨大,且两个数据库之间能连通(如建立DBLink),可采用这种方式。将对数据的处理转换为SQL来实现,将处理完的结果放入到临时表中,所有数据处理完成后将整个表的数据插入到目标库。
这种方式省去了JDBC与数据库的交互,所有操作都在数据库服务器内部进行,这样效率比用程序来实现要高很多。
jessewizard
2011-11-27
打赏
举报
回复
[Quote=引用 1 楼 jingluo 的回复:]
不解:“存在问题是,每次读取的数据要尽量多,这样效率才会高”
根据我导oracle的经验,把一个库的数据导入到另一个库,可以导出到文本(这过程中做要做的处理);导完后,用sqlldr把文本导入到oracle。sqlldr导入还是oracle还是很快的。
仅供参考。
[/Quote]
你可能误解了,我所说的问题是后面一句,不做限制会超内存。
请问你导出到文本是怎么做的呢,是一条条导,还是一批批导呢。按批导应该会更效率吧。
jingluo
2011-11-27
打赏
举报
回复
不解:“存在问题是,每次读取的数据要尽量多,这样效率才会高”
根据我导oracle的经验,把一个库的数据导入到另一个库,可以导出到文本(这过程中做要做的处理);导完后,用sqlldr把文本导入到oracle。sqlldr导入还是oracle还是很快的。
仅供参考。
利用poi获取excel
数据
批量插入
大量
数据
到mysql
该资源主要实现如下功能,利用poi获取excel中
大量
数据
,然后利用
jdbc
批量插入到mysql
JDBC
入门到精通
JDBC
指 Java
数据
库连接,是一种标准Java应用编程接口( JAVA API),用来连接 Java 编程语言和广泛的
数据
库。
JDBC
API 库包含下面提到的每个任务,都是与
数据
库相关的常用用法。制作到
数据
库的连接。创建 SQL 或 MySQL 语句。执行 SQL 或 MySQL 查询
数据
库。查看和修改所产生的记录。从根本上来说,
JDBC
是一种规范,它提供了一套完整的接口,允许便携式访问到底层
数据
库,因此可以用 Java 编写不同类型的可执行文件,例如:Java 应用程序Java AppletsJava ServletsJava ServerPages (JSPs)Enterprise JavaBeans (EJBs)所有这些不同的可执行文件就可以使用
JDBC
驱动程序来访问
数据
库,这样可以方便的访问
数据
。
JDBC
具有 ODBC 一样的性能,允许 Java 程序包含与
数据
库无关的代码。
JDBC
介绍
JDBC
工具类封装
JDBC
防止SQL注入
JDBC
事务
JDBC
分布式两段提交XA
JDBC
操作CRUD
JDBC
批量插入
JDBC
之DDL
jdbc
读取
大量
oracle
数据
,
JDBC
读取
数据
优化-fetch size
最近由于业务上的需求,一张旧表结构中的
数据
,需要提取出来,根据规则,导入一张新表结构中,开发同学写了一个工具,用于实现新旧结构的transformation,实现逻辑简单,就是使用
jdbc
从A表读出
数据
,做了一些处理,再存入新表B中,发现
读取
旧表的操作,非常缓慢,无法满足要求。
读取
数据
的示例代码,conn = getConnection();long start = System.currentT...
JDBC
读取
常见关系型
数据
库中大
数据
需要对
大量
数据
进行处理时,全部
读取
放入内存会导致内存溢出。针对这种处理大
数据
出现的常见问题,可以采用流式
读取
数据
的方法。对于不同的关系型
数据
库,流式
读取
数据
的方式略有不同,下面对常见的关系型
数据
库流式
读取
数据
的方式做一点个人总结。 前提:使用
JDBC
方式
读取
MySQL MySQL中需要特别注意的是
数据
库连接的url,必须配置useCursorFetch=true。例如:
jdbc
:mysql://127.0.0.1:3306/test?characterEncoding=utf8&useSSL
Java SE
62,614
社区成员
307,326
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章