社区
Java
帖子详情
kettle数据移库问题简单问题
辰星0
2012-12-17 11:56:06
[size=16px]现在有源表A表和目标表B表 主键都是ID,更新删除条件也是ID
A表的数据可以通过insert/update同步到B表里,这个处理的都是A表里有B表里没有的数据
现在我想删除B表有A表里没有的垃圾数据。该怎么做?
用delete步骤的时候,删除条件应该怎么写?
...全文
96
2
打赏
收藏
kettle数据移库问题简单问题
[size=16px]现在有源表A表和目标表B表 主键都是ID,更新删除条件也是ID A表的数据可以通过insert/update同步到B表里,这个处理的都是A表里有B表里没有的数据 现在我想删除B表有A表里没有的垃圾数据。该怎么做? 用delete步骤的时候,删除条件应该怎么写?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
辰星0
2012-12-21
打赏
举报
回复
每一个人用过么,没用过的进来讲句话也可以呀,要不我怎么结贴
辰星0
2012-12-18
打赏
举报
回复
kettle 数据移库
ETL之PDI/
Kettle
9.x/8.x案例培训实战从入门到应用案例
学完本课程,您将掌握:PDI/
Kettle
数仓技术PDI/
Kettle
开源免费的ETL推送工具PDI/
Kettle
数据
清洗PDI/
Kettle
数据
抽取PDI/
Kettle
数据
挖掘PDI/
Kettle
案例实战PDI/
Kettle
技巧PDI/
Kettle
9.1版本PDI/
Kettle
通用PDI/
Kettle
水壶技术适合人群:需要
数据
清洗和操作的IT信息化相关人员,IT相关从业人员,大
数据
工程师,
数据
库工程师及DBA,
数据
仓库ETL学习计划:利用碎片化的时间学习即可,每天学习一小时或3个课时即可达到效果;时间充足者,自由安排课程目标:促使教育公平,打破教育壁垒,让ETL更加的大众化使用 课程简介:【可视化介绍】
Kettle
是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,
Kettle
本意是水壶的意思,表达了
数据
流的含义。
Kettle
是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,
数据
抽取高效稳定。【软件版本】 企业用的最多的
Kettle
9.x/8.x/7.x,本教程以最新
Kettle
9.x进行教学【授课方式】 番茄教学法:以知识点为基准,进行独立课时讲解,课时之间低耦合,方便同学利用碎片化时间学习
kettle
数据
同时插入删除
问题
在用
kettle
进行
数据
同步时,发现一个
问题
:目的
数据
库的
数据
少于源
数据
库的
数据
,丢失的
数据
去哪里了呢? 先上图: 步骤1:从源
数据
库抽取
数据
步骤2:删除目的
数据
库的
数据
步骤3:插入到目的
数据
库 但是
问题
来了,这么
简单
的一个过程,到底是哪里出了
问题
呢? 首先,我们需要了解
kettle
的运行过程,如上图,步骤1,2,3虽然是按照顺序执行的,但是是并行的!也就是
使用
kettle
进行
数据
清洗
本实验任务主要完成基于ubuntu环境的使用
kettle
进行
数据
清洗的工作。通过完成本实验任务,要求学生熟练掌握使用
kettle
进行
数据
清洗的方法,为后续实验的开展奠定ETL平台基础,也为从事大
数据
平台运维工程师、大
数据
技术支持工程师等岗位工作奠定夯实的技能基础。1、掌握使用
kettle
进行
数据
清洗Ubuntu16.04、Java1.8、
Kettle
7.1
Kettle
中文名称叫水壶,该项目的主程序员MATT 希望把各种
数据
放到一个壶里,然后以一种指定的格式流出。
Kettle
组成部分:
Kettle
概
kettle
数据
同步完善版
kettle
实现
数据
增量同步完善版 前言 前段时间有记录一次使用
kettle
实现
数据
同步的操作,内容包括
kettle
的安装配置job的创建translate的创建等。 当时做的时候使用使用的是写死的时间点(也就是每次同步的时候都会从这个时间点开始查询
数据
再做对比,并完成
数据
的同步更新到target
数据
源中)。当然开始再
数据
量小并且使用主键ID做
数据
对比的情况下,
数据
同步的速度还是非常快的, 但是随着
数据
的不断增加和不同的业务需求变更,有些业务我们不能使用ID来进行
数据
的对比,这个时候
数据
量特别大的情况下就
【
Kettle
从零开始】第三弹之
Kettle
数据
源连接配置
Kettle
版本:3.2GA JDK版本:1.6.0_41 OS:NT 关于
Kettle
数据
源连接方式有三种:JDBC、ODBC、JNDI、(OCI只针对Oracle DB),但经常用到的只有两种:一种是JDBC,一种是ODBC
数据
库连接方式。
Kettle
中对于
数据
源有作用域的定义,也就是说有全局
数据
源与局部
数据
源两种。 1. 首先打开
Kettle
UI界面,使用快
Java
50,526
社区成员
85,605
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章