社区
DB2
帖子详情
关于海量数据的处理问题
chenxw_mail
2007-07-03 10:29:09
每天大概有100多万条的数据需要从日志文件中读取出来,处理完后插入数据库表,各位有什么好的方案吗?主要是性能方面
...全文
282
7
打赏
收藏
关于海量数据的处理问题
每天大概有100多万条的数据需要从日志文件中读取出来,处理完后插入数据库表,各位有什么好的方案吗?主要是性能方面
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
chenxw_mail
2007-07-04
打赏
举报
回复
db2的load?不懂,另外把这么大的文件一次性装入内存会不会浪费了点?有没有好一点的办法?真的是不懂,各位帮帮忙了
yangxiao_jiang
2007-07-04
打赏
举报
回复
java 读文件的方式就那么几种,只能仔细一点,另外,楼上说的也可以,用db2来处理load过程。
shijubo
2007-07-04
打赏
举报
回复
如果分析后觉得可以先把日志都装入数据库,让数据库来处理的话,可以用db2 load来装,这个是很快的。
yangxiao_jiang
2007-07-03
打赏
举报
回复
按照你的要求,最慢的部分是从日志文件读数据,这个步骤是很慢的,还需要处理,可以把处理的部分放到数据库里执行,现插数据库,然后执行处理过程。
chenxw_mail
2007-07-03
打赏
举报
回复
嗯,对于读文件有什么好的方法吗?我是用java的
yangxiao_jiang
2007-07-03
打赏
举报
回复
100多万条的日志文件,会比较大,从文件读本来就是很慢的,但是这个步骤是不能省略的。
所以这个程序最主要的效率就是看读文件这个部分的效率。
数据的处理,这个过程要看是否复杂,可以把数据的处理交给数据库进行,就是读数据查入到数据库中,然后用存储过程来处理数据。
chenxw_mail
2007-07-03
打赏
举报
回复
不是很明白,可以详细说一下吗?我是新手。只要能在一两个小时内执行完就可以的
Hadoop
海量
数据
处理
:技术详解与项目实战 pdf
影印资料, 本人不负责下载者任何其他后果
Hadoop权威指南 中文版
本书从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hado叩这一高性能
处理
海量
数据
集的理想工具。全书共14章,3个附录,涉及的主题包括:haddoop简介:mapreduce简介:hadoop分布式文件系统;hadoop的i...
微软面试100题系列之高清完整版PDF文档[带目录+标签]by_July
截取本blog索引性文章:程序员面试、算法研究、编程艺术、红黑树、
数据
挖掘5大系列集锦:http://blog.csdn.net/v_july_v/article/details/6543438,中的第一部分编辑而成,涵盖了
数据
结构、算法、
海量
数据
处理
等3大...
海量
数据
处理
面试题集锦
十七道
海量
数据
处理
面试题与Bit-map详解作者:小桥流水,redfox66,July。前言 本博客内曾经整理过有关
海量
数据
处理
的10道面试题(十道
海量
数据
处理
面试题与十个方法大总结),此次除了重复了之前的10道面试题之后...
海量
数据
处理
方法总结
目录
海量
数据
处理
参考链接
数据
时代来临,
数据
量的爆炸式增长是最为显著的特征。当高性能硬件的普及还跟不上这样的
数据
大潮时,如何在有限的时空资源内
处理
海量
数据
成为了计算机科学以及数理统计等领域最大的挑战。 ...
DB2
5,889
社区成员
11,654
社区内容
发帖
与我相关
我的任务
DB2
IBM DB2 是美国IBM公司开发的一套关系型数据库管理系统,它主要的运行环境为UNIX(包括IBM自家的AIX)、Linux、IBM i(旧称OS/400)、z/OS,以及Windows服务器版本
复制链接
扫一扫
分享
社区描述
IBM DB2 是美国IBM公司开发的一套关系型数据库管理系统,它主要的运行环境为UNIX(包括IBM自家的AIX)、Linux、IBM i(旧称OS/400)、z/OS,以及Windows服务器版本
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章