社区
数据仓库
帖子详情
数据增量处理的问题!
laohao
2002-07-05 12:10:06
那位大侠做过数据增量处理的项目,或者手里有这方面的资料,交流一下。
...全文
161
18
打赏
收藏
数据增量处理的问题!
那位大侠做过数据增量处理的项目,或者手里有这方面的资料,交流一下。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
18 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Tommy Chang
2002-07-23
打赏
举报
回复
听说过,跟CRC的方法一样,但问题是并不是从理论上能100%挑出变化的,因为crc也并不能包含字段的全部内容信息,不过有可能效果会不错
:)
bi2002
2002-07-22
打赏
举报
回复
扫描整表应该是很慢,我在某个国外数据仓库站点看到过用一种循环冗余码的扫描整表的算法,是整张表进行扫描的,不但可以发现增量,连改动的都可以发现,这样问题是很好解决的,但不知道实际速度如何,我没具体研究实现过,有兴趣的可以深入钻研一下。好像无论动作,对旧系统的性能都有一定的影响吧。触发器、扫描表、同步复制等,都可以尝试一下。
zzjjww
2002-07-19
打赏
举报
回复
关注中
laohao
2002-07-19
打赏
举报
回复
谢谢各位!不知哪位仁兄手里有此类资料,共享可否?
Tommy Chang
2002-07-15
打赏
举报
回复
呵呵,抛砖引玉。
rdbms中只有集合的概念,没有序列,当然更没有时间序列的概念,都是些加减并余补乘投影等运算。当初提rdbms的时候根本没有增量的概念
:)
yongwc
2002-07-15
打赏
举报
回复
有没有比扫描整表更好一点的方法? 如果可以在旧系统添加触发器也可以实现,不过,会影响旧系统性能。
blueskycn
2002-07-15
打赏
举报
回复
现在好像也没有多少方法,
INMON书上提到的几个,比较,时间字段,整体读取,仿佛也就这些了
如果单就仓库一方面来考虑
但如果仓库跟操作型系统一起设计的时候
或者操作型系统多考虑仓库的时候,会好些
可惜这样的系统我是没看到过
given
2002-07-15
打赏
举报
回复
:)
概念性的东西很多都是人定的,从rdbms来说也没有必要提序列等概念,这只不过我们在做项目时根据实际情况而提出来的。这只不过是个代名词,并没有什么太大的讨论目的。
:)
given
2002-07-13
打赏
举报
回复
我这里的新数据的概念是:数据仓库(数据集市)里面增加了从业务系统里面抽取过来以前没有的那部分数据。
旧数据是我们已经已经从业务系统抽取过来的保存在数据仓库中的那部分数据。
cxgtommy:不知道这样说有没有问题。。。
:)
yongwc
2002-07-12
打赏
举报
回复
问题是,很多旧系统设计的时候根本没有考虑到会有这种抽取问题,现在又不能改动旧的系统,这种情况下,如果做增量呢? 不一定要是很好的方法,自要能够实现,并且尽可能好就行了,大家想想,我一直在考虑
Tommy Chang
2002-07-12
打赏
举报
回复
从关系型数据库角度来看,无所谓新旧之分,这是历史问题。什么叫新数据,什么叫旧数据?
:)
given
2002-07-12
打赏
举报
回复
同意yongwc的看法,我也在想这样的问题。但是我觉得除了时间和状态标志之外,一般的业务数据系统应该不会在提供其他能够实现增量方式。个人认为,既然是增量就是对一些以前没有出现的数据从新抽取进来。这点绝大部分应该是从纵观角度分析,如果这样的话,那最可行的方法就只能是时间。另一种就是根据业务系统存在一个类似自动编号的字段。
对于其他关注中。。。
jlandzpa
2002-07-11
打赏
举报
回复
关键是数据必须有个时间戳,或者能够区别是否为增量的标志,
有的话,方法就很多了.
jlandzpa
2002-07-11
打赏
举报
回复
关键是数据必须有个时间戳,或者能够区别是否为增量的标志,
有的话,方法就很多了.
stevenzeng
2002-07-10
打赏
举报
回复
数据仓库项目中的增量数据处理,一直都是很麻烦的一个环节。
我倒是做过一个这样的项目,处理起来也很头疼(花大量的时间、人力)。
最好的方式就是在原始数据库中,每张表都有一个时间戳和记录数据状态的状态标志。如果在操作数据库中没有这些标记,则需要你自己想办法去产生了。
有时间可以多交流。
given
2002-07-09
打赏
举报
回复
一般的增量问题都使用时间进行增量的,如果是其他的花,增量问题实现起来很难。这些增量在很多数据库都能提供,MS SQL,db2的dw,还有的就是sybase,oracle都能解决。
Tommy Chang
2002-07-05
打赏
举报
回复
好像作过数据仓库没有不需要增量处理的吧?
:)
Mars_Mao
2002-07-05
打赏
举报
回复
关注中!
增量
处理
解决方案
增量
处理
解决方案
问题
归纳:如果定时对Cube进行完全
处理
,
数据
量少还没有
问题
,但是如果
数据
多的话,时间开销将会非常厉害。如果改由按年或者月份分区
处理
的话稍微可以缓解
处理
压力,但是如果对于实时性要求比较高的...
数据
仓库
增量
数据
获取方式解决方案
这第一种可以是由源系统在
数据
处理
过程当中由应用程序直接记录
增量
数据
,产生
增量
数据
文件。这种做法对源系统的效率会有较大影响,需要改造源系统的应用(植入获取
增量
数据
的程序)所以如果源系统方比较...
Canal 实现
数据
增量
同步
今天这篇文章使用阿里开源的中间件Canal解决
数据
增量
同步的痛点。 文章目录如下: Canal是什么? canal译意为水道/管道/沟渠,主要用途是基于MySQL
数据
库
增量
日志解析,提供
增量
数据
订阅和消费。 从..
监控mysql表的
增量
_一种
数据
库
数据
增量
实时监控方法与流程
本发明涉及
数据
库
数据
增量
监控技术领域,具体是一种
数据
库
数据
增量
实时监控方法。背景技术:在实际软件产品使用过程中,对
数据
变化的各种状态,需要有相应实时的信息获知,以满足根据
数据
状态执行相应的默认、隐匿、...
谈谈
数据
的
增量
更新
在
数据
同步的过程中,必然会遇到
数据
增量
更新的需求。但如果没有一个有效的
数据
增量
更新的设计与机制,可能每次上游
数据
更新时,你都需要将全量的
数据
同步一遍,即使只有1%的
数据
发生了更新。 全量
数据
同步在
数据
...
数据仓库
7,388
社区成员
6,742
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章