社区
数据仓库
帖子详情
数据仓库针对事实表的历史数据变更处理方式
z184931481
2018-03-06 03:06:35
环境用的是SQL Server做物理存储,ETL用的是Kettle,通常在会对业务数据进行抽取做事实表,但业务数据每一天都会有变更(新增,修改,删除),想准备对这张事实表上的字段做对比,然后将变化的字段作为异动记录存储到另一个事实表中,请问如果是这种做法应该怎么做,还有其他更好的解决方法吗?
...全文
4008
3
打赏
收藏
数据仓库针对事实表的历史数据变更处理方式
环境用的是SQL Server做物理存储,ETL用的是Kettle,通常在会对业务数据进行抽取做事实表,但业务数据每一天都会有变更(新增,修改,删除),想准备对这张事实表上的字段做对比,然后将变化的字段作为异动记录存储到另一个事实表中,请问如果是这种做法应该怎么做,还有其他更好的解决方法吗?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xphDeV
2018-03-23
打赏
举报
回复
可以考虑拉链表的做法,
好难取名
2018-03-14
打赏
举报
回复
你不对原始表做修改,那么你只抓增量,在旧表中存在的不就是变更数据么。变更的你直接存在另一张表就行了啊
z184931481
2018-03-07
打赏
举报
回复
顶一个没人回答吗
相关推荐
数据仓库
专题(11)-可以作为维度表使用的
事实表
KDT#13 可以作为维度表使用的
事实表
事实表
从粒度的角度分为三种,分别是交易粒度
事实表
、周期快照
事实表
和累计快照
事实表
。 交易粒度
事实表
能提供某个确切时刻的描述信息。以银行帐户中保存的客户信息为例来说,代理机构会周期的更新客户的名称、地址、电话号码、客户分类、信用等级、风险等级及其他描述性信息。建立的交易粒度
事实表
如下所示:
变更
日期(FK)帐户号(SK) 代理(FK) 客户信息
变更
数据仓库
建模的十条意见
数据仓库
建模的十条意见 1) 必须回答紧迫的问题;2) 必须有正确的
事实表
;3) 将有正确的维表,描述必须按最终用户的业务术语表达;4) 必须理解
数据仓库
所影响的公司过程或影响
数据仓库
的公司过程;5) 对于
事实表
,应该有正确的“粒度”;6) 根据需要存储正确长度的公司
历史数据
;7)
数据仓库
专题(3)-分布式
数据仓库
事实表
设计思考
一、前言 最近在设计
数据仓库
的数据逻辑模型,考虑到海量数据存储在分布式
数据仓库
中的技术架构模式,需要针对传统的面相关系型
数据仓库
的数据存储模型进行技术改造。设计出一套真正适合分布式
数据仓库
的数据存储模型。 二、
事实表
设计基础
事实表
记录发生在现实世界中的操作型事件,其所产生的可度数值。
事实表
的设计完全依赖于物理活动,不受可能产生的最终报表的影响。
事实表
中,除数字度量外,
事实表
...
6.分布式
数据仓库
事实表
设计思考
一、前言 最近在设计
数据仓库
的数据逻辑模型,考虑到海量数据存储在分布式
数据仓库
中的技术架构模式,需要针对传统的面相关系型
数据仓库
的数据存储模型进行技术改造。设计出一套真正适合分布式
数据仓库
的数据存储模型。 二、
事实表
设计基础
事实表
记录发生在现实世界中的操作型事件,其所产生的可度数值。
事实表
的设计完全依赖于物理活动,不受可能产生的最终报表的影响。
事实表
中,除数字度量外,
事实表
...
数据仓库
之维表-缓慢变化维
数据仓库
的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化 。与数据增长较为快速的
事实表
相比,维度变化相对缓慢。 在一些情况下,保留
历史数据
没有什么分析价值;而在另一些情况下,保留
历史数据
将会起到至关重要的作用。在 Kimball 的理论中, 有三种处理缓慢变化维的方式,下面通过简单的实例进行说明。 第一种
处理方式
:重写维度值。采用此种方式,不保留
历史数据
,始终取...
数据仓库
7,380
社区成员
6,743
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告