如何决定哪些表需要delta增量更新

hunter1ok 2014-09-23 10:54:25

我们现在的数据集市每天都是全表删除更新（有点怪？）。由于主题质量等原因，现在要重建。

请教下，通常怎么决定哪些表需要delta增量更新？交易事实表肯定可以。
一般比如产品表，客户表，地址表呢？
聚集后的比如每客户月度收入事实表呢？

另一个问题：如果要引入slow change dimension，一般的项目，会建多少个SCD？比如客户信息表，dim_customer,有三十个左右属性（单位，行业，电话，地址，预付费/月账单），10个左右计算结果（如月消费1000-3000），那么通常大家会考虑建多少个缓慢变化惟呢？不会40个列全部都建吧？

多谢！

...全文

1124 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

hunter1ok 2014-09-30

打赏
举报

回复

自己找到答案了http://www.cnblogs.com/biwork/p/3446236.html 数据仓库增量数据处理一般发生在从 Source 到 Staging 的过程中，从 Staging 到DW 一般又分为维度 ETL 处理和事实 ETL 处理两个部分。那么实际上从 Source 到 Staging 的过程中，就已经有意识的对维度和事实进行了分类加载处理。通常情况下，作为维度的数据量较小，而作为业务事实数据量通常非常大。因此，着重要处理的是业务事实数据，要对这一部分数据采取合适的增量加载策略。通常情况下，对数据仓库从 Source 到 Staging 增量数据的处理可以按照这种方式：对于具有维度性质的数据表可以在 Staging 中采取全卸载，全重新加载的模式。即每次加载数据的时候，先将 Staging 表数据清空掉，然后再重新从数据源加载数据到 Staging 表中。对于具有事实性质的数据表，需要考虑使用上面通用的集中增量数据处理的方案，选择一个合适的方式来处理数据。保证在 Staging 事实中的数据相对于后面的 DW 数据库来说就是新增的或者已修改过的数据。但是也不排除大维度表的情况出现，即具有维度性质的数据表本身就非常庞大，像会员表有可能作为维度表，动辄百万甚至千万的数据。这种情况下，也可以考虑使用合适的增量数据加载策略来提高加载的性能。至于从 Staging 到 DW 的这一过程，通常情况下包含了维度 SCD 过程和事实 Lookup 过程

话说这我就不明白了。对于频繁更新的交易数据，在初始化增量抽取之后，后续的增量抽取请求上，有以下这几个选项：在开始看delta请求的处理模式之前，我们得理解下DTP加载和package之类的概念。 DTP加载就是从源到目标，package的话，大小会影响到DTP的执行时间长短。包是啥呢，就是把一组数据包进一个包里。那包的大小呢，就是能容纳的记录的多少。默认包大小是50000。你可以增大或者缩小包大小。根据你转换里面逻辑的复杂程度，例程的多少，数据源数据量大小，DTP的处理模式（就是下面要讲的）来

"增量更新Delta Update"区：存储的是至上次提取之后到时目前所有增量的数据；每次抽取之后（不管是从"增量更新Delta Update"区还是从"增量重复Delta Repetition"区抽取，只要发生抽取，则会被清空）该区就会被清空；如果上次抽取没有出错下次还会从该区抽取"增量重复Delta Repetition"区：存储了上一次被抽取的所有数据、及从上一次抽取之后到目前所有增量数据（...

SAP中的增量机制，可以有助系统提高数据抽取效率，在初始化执行后，每天只更新新增和修改了的记录。在我们正常的使用或开发中，这些东西并不需要知道，只要数据正常上载，就好了，此处所介绍的内容之为大家参考用。在介绍DELTA机制之前，先介绍下DSO和CUBE： DSO：一般DSO用来存储明细数据，其结构比较简单。对于值的转换（决定了可用的DELTA类型），既可以使用合计，也可...

SAP中的增量机制，可以有助系统提高数据抽取效率，在初始化执行后，每天只更新新增和修改了的记录。在我们正常的使用或开发中，这些东西并不需要知道，只要数据正常上载，就好了，此处所介绍的内容之为大家参考用。在介绍DELTA机制之前，先介绍下DSO和CUBE：DSO：一般DSO用来存储明细数据，其结构比较简单。对于值的转换（决定了可用的DELTA类型），既可以使用合计，也可以使用覆盖的方式。激活DSO后...

Android增量更新是移动应用优化发布周期的关键技术，它只更新应用中有变化的部分，极大地减少了数据传输量和用户的下载时间。本章节将浅入深地探讨Android增量更新的原理和实践，旨在帮助开发者更高效地实现应用更新。增量更新基于源代码或二进制文件的差异进行更新。它通常包含以下几个核心步骤：1. 对比新旧版本，生成差异文件（Patch）；2. 将差异文件传输给客户端；3. 客户端应用差异文件，完成更新。随着本章节的深入，我们将详细解析每个步骤的实现细节以及最佳实践。

7,394

社区成员

6,741

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章