关于海量数据的处理问题

chenxw_mail 2007-07-03 10:29:09

每天大概有100多万条的数据需要从日志文件中读取出来，处理完后插入数据库表，各位有什么好的方案吗？主要是性能方面

...全文

282 7 打赏收藏转发到动态举报

写回复

用AI写文章

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

chenxw_mail 2007-07-04

打赏
举报

db2的load?不懂，另外把这么大的文件一次性装入内存会不会浪费了点？有没有好一点的办法？真的是不懂，各位帮帮忙了

yangxiao_jiang 2007-07-04

打赏
举报

java 读文件的方式就那么几种，只能仔细一点，另外，楼上说的也可以，用db2来处理load过程。

shijubo 2007-07-04

打赏
举报

如果分析后觉得可以先把日志都装入数据库，让数据库来处理的话，可以用db2 load来装，这个是很快的。

yangxiao_jiang 2007-07-03

打赏
举报

按照你的要求，最慢的部分是从日志文件读数据，这个步骤是很慢的，还需要处理，可以把处理的部分放到数据库里执行，现插数据库，然后执行处理过程。

chenxw_mail 2007-07-03

打赏
举报

嗯，对于读文件有什么好的方法吗？我是用java的

yangxiao_jiang 2007-07-03

打赏
举报

100多万条的日志文件，会比较大，从文件读本来就是很慢的，但是这个步骤是不能省略的。

所以这个程序最主要的效率就是看读文件这个部分的效率。

数据的处理，这个过程要看是否复杂，可以把数据的处理交给数据库进行，就是读数据查入到数据库中，然后用存储过程来处理数据。

chenxw_mail 2007-07-03

打赏
举报

不是很明白，可以详细说一下吗？我是新手。只要能在一两个小时内执行完就可以的

影印资料，本人不负责下载者任何其他后果

本书从hadoop的缘起开始，由浅入深，结合理论和实践，全方位地介绍hado叩这一高性能处理海量数据集的理想工具。全书共14章，3个附录，涉及的主题包括：haddoop简介：mapreduce简介：hadoop分布式文件系统；hadoop的i...

截取本blog索引性文章：程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大系列集锦：http://blog.csdn.net/v_july_v/article/details/6543438，中的第一部分编辑而成，涵盖了数据结构、算法、海量数据处理等3大...

十七道海量数据处理面试题与Bit-map详解作者：小桥流水，redfox66，July。前言本博客内曾经整理过有关海量数据处理的10道面试题（十道海量数据处理面试题与十个方法大总结），此次除了重复了之前的10道面试题之后...

目录海量数据处理参考链接数据时代来临，数据量的爆炸式增长是最为显著的特征。当高性能硬件的普及还跟不上这样的数据大潮时，如何在有限的时空资源内处理海量数据成为了计算机科学以及数理统计等领域最大的挑战。 ...

DB2

5,889

社区成员

11,654

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章