社区
疑难问题
帖子详情
ETL跑数据问题
阿甘的反击
2010-06-29 09:53:03
一般都是夜里从业务系统抽数据吧,例如有个日均指标,每天都要用到上一天的数据来计算出当天的数据,如果要是发现n天之前的数据业务系统出错了,那么就要从那一天重新跑。一般如何避免这种情况发生呢?
...全文
194
7
打赏
收藏
ETL跑数据问题
一般都是夜里从业务系统抽数据吧,例如有个日均指标,每天都要用到上一天的数据来计算出当天的数据,如果要是发现n天之前的数据业务系统出错了,那么就要从那一天重新跑。一般如何避免这种情况发生呢?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
阿甘的反击
2010-06-30
打赏
举报
回复
例如抽取财务报表的数据,我们自己还要再实现一次财务数据的公式,但只做与数据源的校验。就是怕业务系统本身存在bug导致源始错的。。。哎。。。。关键是担心迭代好多天了,回头重新刷数据烦啊。。总之,对需要迭代的数据一定要把业务数据规则搞清楚并且要与业务系统接口的负责人好好沟通。。
nalnait
2010-06-30
打赏
举报
回复
根据最后抽的时间和原库的最大时间进行比较了
claro
2010-06-30
打赏
举报
回复
没有抽过
帮顶
「已注销」
2010-06-30
打赏
举报
回复
关注!
流氓兔
2010-06-29
打赏
举报
回复
[Quote=引用楼主 fanyingnedu 的回复:]
一般都是夜里从业务系统抽数据吧,例如有个日均指标,每天都要用到上一天的数据来计算出当天的数据,如果要是发现n天之前的数据业务系统出错了,那么就要从那一天重新跑。一般如何避免这种情况发生呢?
[/Quote]
加时间,那天出错了就跑那天的数据
铁臂阿童木头
2010-06-29
打赏
举报
回复
先顶一下。按照你所说的情况,这里计算的数据是一个不断迭代的过程,那么在执行计算之前,应当设计一套完善的数据校验功能,主要是针对源数据的校验,竟可能的避免由于源数据错误而导致本次计算的错误,同时需要保证计算数据的业务逻辑的正确性。
源数据校验有很多方法,需要根据具体的业务逻辑来具体设计,对于你讲的这个问题,我觉得可以设置一个时间范围,比如说对3天之内的数据进行校验,至于校验方法可以用你的数据计算算法来重新计算某一天的数据,与已经计算好的数据进行对比,这只是一种思路,方法肯定会有很多的。
xyj052
2010-06-29
打赏
举报
回复
帮顶!!!!
大
数据
应用测试经验总结.pdf
计算引擎:使⽤Hive on Tez计算引擎实现
ETL
跑
批任务;使⽤spark streaming实现实时计算;使⽤Phoenix做前台交互式查询。 3.
数据
存储:使⽤Kafka、Hive、Hbase、MySQL满⾜各层次存储技术需求。 4. 任务调度:使⽤...
ETL
-master:这是我们论文的pytorch实现
ETL
主站这是我们论文的一个pytorch实施:“在跨域推荐中实现用户首选项的等效转换”
跑
步技巧此文件夹包含本文中使用的三个
数据
集以及
ETL
模型的代码。 具体来说,在本文的脱脂研究中,main_my.py是我们的模型,其他...
推荐系统
ETL
数据
分析处理
推荐算法系统
ETL
数据
处理实战 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,新书教材配合此实战课程结合学习,一静一动,互补高效学习!本...
etl
-web-scraping
ETL
从Web抓取
数据
并将其存储到Postgres
数据
库 网页抓取 网址: https://id.wikipedia.org/wiki/Daftar_orang_terkaya_di_Indonesia : https://id.wikipedia.org/wiki/Daftar_orang_terkaya_di_Indonesia 要求 码头...
【Spark2运算效率】第四节 影响生产集群运算效率的原因之
数据
倾斜
当
ETL
调度任务所能拥有的资源能够满足其在较为资源冗余的状况下实施运算,长时间的运算过程中可能是涉及了
数据
倾斜的现象;
数据
倾斜可以说是分布式运算中不可避免的一种现象,这种现象带来的后果就是任务执行时长会...
疑难问题
22,209
社区成员
121,731
社区内容
发帖
与我相关
我的任务
疑难问题
MS-SQL Server 疑难问题
复制链接
扫一扫
分享
社区描述
MS-SQL Server 疑难问题
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章