DB2中,大数据量的实时入库(需要兼顾查询)

Green_sanD 2007-09-29 10:29:41

我们有个需求,大致以5分钟调度一次入库操作,每次入的数据量为10万,需要保存这样90天的数据.

表中有时间,业务发起方代码,业务终止方代码,业务详细信息详细信息的状态码四个索引.

我们,需要在入库后的5分钟内实现对入库数据的查询.

目前,考虑使用DB2 9版本,对数据进行一天一张表的存放,当随着表中数据量的增长,到下午时,LOAD入库就已经很难达到要求.估计,得考虑分到一时一张表,但这样,对查询得影响时怎样,没有测试过.希望,有经验得达人共同讨论下,性能怎样调整.

目前,已经测试过DB2提供得表分区方案,因为入库直接在分区表上进行,性能很差,已经放弃;LOAD将数据入小表,然后ATTACH到大表,也因为每次ATTACH后都要设置完整性才可以查询,而SET INT每次都时对全局索引进行整理,时间耗费非常巨大,也已经放弃;目前方案中,LOAD入表,到下午性能降低,也是因为每次都整理全表索引所致.

...全文

323 10 打赏收藏转发到动态举报

写回复

10 条回复

切换为时间正序

请发表友善的回复…

发表回复

anyezhitong 2007-10-31

打赏
举报

回复

基本上没有什么好的办法，你还是考虑分表处理吧。就几个表按循环顺序来吧。
DB2 LOAD的起动速度太慢，就算你按分区建库以后，按你的数据量，估计以后5分能不能完成启动都是一个问题。
而且在LOAD的时候，查询的效率也会让你吐血的。

phallus 2007-10-23

打赏
举报

回复

你应该建立以那四个索引为CLUSTER INDEXING的分区，这样当你用小表LOAD入以后就可以直接ATTACH进取而不需要做任何的重组。你可以试试这个方法。好的话告诉我一声。

raulchen 2007-10-21

打赏
举报

回复

数据库表分区怎么设计阿哪位大虾能指点指点....

Green_sanD 2007-10-11

打赏
举报

回复

3楼老大,实际我们说要存90天,但现在考虑的是用90个天表来存,实际查询中,也不会有在90天表中都查询的(应用会加权限控制).

因此,需要着力考虑的是:一天的数据入库查询效率如何解决.

Green_sanD 2007-10-11

打赏
举报

回复

4楼,LOAD到小表,然后INSERT到大表,方案我们讨论过,而且也实际测试过.
实际上,LOAD真正从文本到数据表的过程也是很快的,慢的是数据合并完成后,对全表重整索引;如果相同的数据量,LOAD后INSERT,实际上,整理索引的时间花费更长.因为是插一条,整理一下.而且,CPU利用率很低,但使用时间很长.

5楼,分区数据库我们也用到了,但不知道你所说的LOAD一个分区查询一个分区如何实现,我们LOAD的分区就是要马上投入查询用的.

目前所用到的机器,大概有 8C 16G,分区数量有8个.

itcncs 2007-10-09

打赏
举报

回复

使用分区数据库，load是一个分区，查询是一个分区

linguo2000 2007-09-30

打赏
举报

回复

load数据到小表然后insert到大表呢？楼主
另外加载太慢是不是跟索引太多有关系？
没有经过验证的想法，拿出来大家探讨一下。

yangxiao_jiang 2007-09-30

打赏
举报

回复

如果有好方法，记得通知大家。

Mr_Bean 2007-09-30

打赏
举报

回复

90天内最终将存储将近26亿条纪录，这样纪录数的查询本身就是一个值得考虑的问题
以目前的数据库来看，没有那个数据库能达到这样的数量级～
只能从根本上更改这样的设计了～

jarycxd 2007-09-29

打赏
举报

回复

以你们目前的这种数据量，暂时很难找到好的方法保证查询，我也期待达人来提供好的意见

用户可以把MyCAT看作是一个数据库代理，用mysql客户端工具（如Navicat）和命令访问，其核心功能就是分库分表，即将一个大表水平分割为N个小表，真正的存储在后端Mysql服务器中或其它数据库中。 ...

一.背景分析传统关系型数据库在企业市场长期占有稳固的统治地位，许多人都不曾意识到除了传统关系型之外还有其他类型的数据库。传统关系型数据库非常善于处理事务的事务性操作，例如更新操作。但是在处理大数据量的批量操作时候就有点捉襟见肘。例如DB2作为IBM公司开发的一套关系型数据库管理系统，被广泛应用于大型数据仓库项目中，特别是移动行业，自构建经营分析系统以来，基本都...

数据作为新型生产要素，是数字化、网络化、智能化的基础，已快速融入生产、分配、流通、消费和社会服务管理等各个环节，深刻改变着生产方式、生活方式和社会治理方式。通过数字化转型以发挥数据要素对于企业的生产经营价值成为大多数企业的必然选择。数据中台承载着利用数据驱动业务决策所需的一系列能力，是众多企业建设数据能力、开展数字化转型时难以避开的话题，部分企业已经将其作为企业数字化转型的核心引擎。当前数据中台已成为企业综合数据能力建设的一种形式。

前言现在企业的报表开发大部分都使用报表工具完成，成熟的报表工具提供了丰富的显示设置、图表类型、导出打印等功能可以简化报表开发，非常方便。但在实际报表开发中还是经常碰到一些非常棘手的深层次问题，即使是已经熟练使用报表工具的开发老手也会很挠头。为什么有了报表工具还会出现这些问题呢？报表开发，看起来就是将数据按照指定格式的表格或图形呈现出来，这也是报表工具一直以来很擅长的环节。但是，原始数据经常并不适合直接呈现，需要先做一些复杂的处理，这就是数据准备环节。从报表工具的眼光上看，数据准备属于报表之外

数据库大数据量、高并发、高可用解决方案，十万字图文详解mysql、redis、kafka、elasticsearch（ES）多源异构不同种类数据库集成、数据共享、数据同步、不同中间件技术实现与方案，如何构建数据仓库、数据湖、数仓一体化？Delta Lake、Apache Hudi和Apache Iceberg数仓一体化技术架构实现。

5,889

社区成员

11,654

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章