社区
数据仓库
帖子详情
跪求大神!kettle如何实现定时将每日业务库增量同步到备用库!
zhenS1mple
2021-05-20 09:15:34
描述:各位大神,我oracle数据库小白,前些日子接到老板需要的一个数据仓库的任务,在面向百度一翻操作后了解到数据仓库的一些知识,首先就是有个数据分层的概念,说到数据分层这时候就遇到了一个数据同步的问题,几番搜索结合自身情况,感觉kettle合适,需要将每天的业务数据增量导入到数据仓库的元数据层。但是百度许久,未能找到一些合理的办法,希望各路大神给点建议和帮助。
...全文
3757
1
打赏
收藏
跪求大神!kettle如何实现定时将每日业务库增量同步到备用库!
描述:各位大神,我oracle数据库小白,前些日子接到老板需要的一个数据仓库的任务,在面向百度一翻操作后了解到数据仓库的一些知识,首先就是有个数据分层的概念,说到数据分层这时候就遇到了一个数据同步的问题,几番搜索结合自身情况,感觉kettle合适,需要将每天的业务数据增量导入到数据仓库的元数据层。但是百度许久,未能找到一些合理的办法,希望各路大神给点建议和帮助。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Jasowen
2021-08-26
打赏
举报
回复
估计已经找到了吧,没有的话看这里
http://www.spring4all.com/article/600
Kettle
实现
数据
库
的
增量
同步
kettle
实现
两个Mysql数据
库
的
增量
同步
使用
Kettle
实现
数据实时
增量
同步
0. 前言 本文介绍了使用
Kettle
对一张
业务
表数据(500万条数据以上)进行实时(10秒)
同步
,采用了时间戳
增量
回滚
同步
的方法。关于ETL和
Kettle
的入门知识大家可以阅读相关的blog和文档学习。 1. 时间戳
增量
回滚
同步
假定在源数据表中有一个字段会记录数据的新增或修改时间,可以通过它对数据在时间维度上进行排序。通过中间表记录每次更新的时间戳,在下一个
同步
周期时,通过这个时...
【
Kettle
】——
Kettle
增量
同步
变动数据
需求: 最近在用
kettle
同步
数据的时候,有
增量
同步
的需求。 之前也遇到过这个需求,查阅了很多文章,也试了很多方法,都没有
实现
我所需的简洁的方式。 这回在我一次次尝试无果的情况下,突然间的灵光一闪,让我豁然开朗,原来你就在我眼前。 写下这篇文章,让更多的人的时间得到节省。 时间是最稀缺的资源,更多的时间应该花在更有意义的事情上。 软件相关: 使用软件
kettle
...
kettle
实现
mysql单表
增量
同步
kettle
实现
单表
增量
同步
实现
增量
同步
整体分为三个步骤:(以mysql数据
库
为例,其他数据
库
同理,本人亲测可用,若有不足,欢迎留言指出) 1、获取上次
同步
时间。 2、查询上次
同步
时间以外的数据,并新增到目标
库
中。 3、记录本次
同步
时间,为下次
同步
使用。 一、获取上次
同步
时间 新建
同步
时间记录表,记录每次
同步
的时间和
同步
结果,建表sql如下: CREATE TABLE `kg_log` ( `FD_OBJECTID` varchar(50) NOT NULL COMMENT '主键',.
利用
kettle
实现
oracle到mysql数据
库
增量
同步
方案(自创)
近期涉及一个BI项目初期阶段,构建数据仓
库
时遇到不少问题,主要问题,来源已下几个方面: 1 不同
业务
数据放在不同类型的数据
库
(oracle和mysql的,excel等等)。 2 源端数据
库
种类不同,表结构创建语句与设计不一,导致不好
同步
问题。 3 源端数据
库
只提供只读状态,无法对源端做起停和写操作。 4 源数据
库
中没有定义和更新时间字段无法做到
增量
同步
。 ...
数据仓库
7,394
社区成员
6,741
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章