关于海量数据的处理问题

chenxw_mail 2007-07-03 10:29:09
每天大概有100多万条的数据需要从日志文件中读取出来,处理完后插入数据库表,各位有什么好的方案吗?主要是性能方面
...全文
282 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
chenxw_mail 2007-07-04
  • 打赏
  • 举报
回复
db2的load?不懂,另外把这么大的文件一次性装入内存会不会浪费了点?有没有好一点的办法?真的是不懂,各位帮帮忙了
yangxiao_jiang 2007-07-04
  • 打赏
  • 举报
回复
java 读文件的方式就那么几种,只能仔细一点,另外,楼上说的也可以,用db2来处理load过程。
shijubo 2007-07-04
  • 打赏
  • 举报
回复
如果分析后觉得可以先把日志都装入数据库,让数据库来处理的话,可以用db2 load来装,这个是很快的。
yangxiao_jiang 2007-07-03
  • 打赏
  • 举报
回复
按照你的要求,最慢的部分是从日志文件读数据,这个步骤是很慢的,还需要处理,可以把处理的部分放到数据库里执行,现插数据库,然后执行处理过程。
chenxw_mail 2007-07-03
  • 打赏
  • 举报
回复
嗯,对于读文件有什么好的方法吗?我是用java的
yangxiao_jiang 2007-07-03
  • 打赏
  • 举报
回复
100多万条的日志文件,会比较大,从文件读本来就是很慢的,但是这个步骤是不能省略的。

所以这个程序最主要的效率就是看读文件这个部分的效率。

数据的处理,这个过程要看是否复杂,可以把数据的处理交给数据库进行,就是读数据查入到数据库中,然后用存储过程来处理数据。
chenxw_mail 2007-07-03
  • 打赏
  • 举报
回复
不是很明白,可以详细说一下吗?我是新手。只要能在一两个小时内执行完就可以的

5,889

社区成员

发帖
与我相关
我的任务
社区描述
IBM DB2 是美国IBM公司开发的一套关系型数据库管理系统,它主要的运行环境为UNIX(包括IBM自家的AIX)、Linux、IBM i(旧称OS/400)、z/OS,以及Windows服务器版本
社区管理员
  • DB2
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧