社区
Java SE
帖子详情
关于 大数据量顺序进行处理机制
Qingjian
2007-12-27 01:29:32
使用 数据库 oracle
语言 java
表 tab1
1、 有个c++程序 不停往tab1 里面插入数据(多线程)
2、 我写程序每次会去取10w条记录 进行处理
3、现在要保证 我每次取数据的时候 要有个顺序 先进的先取! 由于数据量很大 没有在sql 中order by 进行排序 只是很简单的 select * from tab1 where rownum <10w
想问一下有什么好的办法可以 在不影响效率的情况 有可以保证 执行的数据是顺序的?
...全文
126
6
打赏
收藏
关于 大数据量顺序进行处理机制
使用 数据库 oracle 语言 java 表 tab1 1、 有个c++程序 不停往tab1 里面插入数据(多线程) 2、 我写程序每次会去取10w条记录 进行处理 3、现在要保证 我每次取数据的时候 要有个顺序 先进的先取! 由于数据量很大 没有在sql 中order by 进行排序 只是很简单的 select * from tab1 where rownum <10w 想问一下有什么好的办法可以 在不影响效率的情况 有可以保证 执行的数据是顺序的?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
joejoe1991
2007-12-31
打赏
举报
回复
用索引吧。
跟分页有点类似哇。
老紫竹
2007-12-31
打赏
举报
回复
gc 回收的效率问题?
内存溢出? 我用多线程处理过3亿的复方丹参滴丸生产数据都没有这个问题的。
可能原因2个
1 是不是你的初始内存设置的太小了?修改一下JVM的参数
-Xms512m -Xmx512m -XX:MaxPermSize=64m
呵呵,如果你没有512M,那256也将就,后面的64m就别增加了。
2 如果上面的不行,那就是你的代码有问题哦!
Qingjian
2007-12-30
打赏
举报
回复
现在主要有个 问题 就是 有什么好的模式 可以对 jdk 的内存进行控制 应为每次取数据都会 new Object , 但是 java中的 gc 回收的效率太慢了,
现在最后会内存溢出, 有什么好的方法 可以进对象重用!
gzhiceberg
2007-12-28
打赏
举报
回复
easy
order by 没关系,只要给order by 的字段加个索引就好,10w的量不在啊
老紫竹
2007-12-27
打赏
举报
回复
一个生产者和多个消费者的模式比较好
生产者,负责从数据库读取数据
消费者负责从生产者拿一个数据,然后离开进行处理,处理完毕再要下一个数据
这样,只要在拿数据的时候,保证不出现一个数据给多个消费者就可以了。
qianxf2008
2007-12-27
打赏
举报
回复
多线程插入数据,不锁表吗??
学习...
G-Sockets 2.5
G-Sockets 2.5 1、补丁发送GBuf可能导致乱序的Bug, 2、Delphi版增加内存加载DLL的功能, 3、增加授权证书功能,开发平台调试和本地IP调试均能全功能调试。
服务器面对大
量
数据上传处理思想
同样是一个面试问题,面对大
量
设备同时传入数据如何处理,记录下来。 当大
量
设备连接服务器,大
量
数据上传到服务器,服务器要如何提高处理能力,来处理这些数据,数据源为设备数据。 服务器处理数据可以从已下几个方面考虑, 1.排队列
处理机
制
。数据涌入服务器,但还是能够区分先后
顺序
,按照数据传输时序将数据摘要排入队列,然后服务器按队列依次
进行
处理。 2.数据分类机
制
。数据分类和优先级处理一起使用,将数...
服务器如何处理大
量
数据?
1.排队列
处理机
制
。数据涌入服务器,但还是能够区分先后
顺序
,按照数据传输时序将数据摘要排入队列,然后服务器按队列依次
进行
处理。 2.数据分类机
制
。数据分类和优先级处理一起使用,将数据按照不同的类型
进行
分类,例如,可以将设备状态分为一类数据,将监控数据分为一类数据,将操作员正常操作设备数据分为一类,将操作员非法操作设备分为一类等,将不同的类型,按照其重要程度,放入不同的优先级队列中,按照优先级队列依...
大数据
量
下,多线程任务处理打乱集合数据原有
顺序
问题的解决方案
在循环中使用多线程的情况下,不能保证任务的执行
顺序
与原来的
顺序
一致。因为多线程的任务在执行过程中是并行的,各个任务的执行完成时间是不确定的。在上述的代码中,使用了executor.submit()方法将任务提交给线程池执行。线程池会根据可用的线程数和任务队列的情况来决定任务的执行
顺序
。尽管代码中使用了synchronized关键字对list
进行
了同步控
制
,但它仅保证了在同一时间只有一个线程可以
进行
list.add操作。即使保证了同步,不同线程执行完任务后,它们将按照任务完成的
顺序
尝试添加到list中。
大数据
量
的五种处理方式
http://www.51projob.com/a/bishimianshi/hailiangshuju/2012/0322/111.html 处理海
量
数据问题,无非就是: 分而治之/hash映射 + hash统计 + 堆/快速/归并排序; Bloom filter/Bitmap; Trie树/数据库/倒排索引; 外排序; 分布式处理之hadoop/mapreduce。 本文接下...
Java SE
62,623
社区成员
307,257
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章