社区
community_281
帖子详情
ETL在执行时会把业务库托的很慢怎么弄?
gavinwwl
2012-03-31 05:09:00
每次执行ETL过程,都会把业务库托的很慢,很影响使用,不知道各位有没有高招指点一下。
(由于系统为全球使用,不可以单纯的像网上有些讲的在早上没有人用的时候执行,因为系统一直都有人在使用)
...全文
145
10
打赏
收藏
ETL在执行时会把业务库托的很慢怎么弄?
每次执行ETL过程,都会把业务库托的很慢,很影响使用,不知道各位有没有高招指点一下。 (由于系统为全球使用,不可以单纯的像网上有些讲的在早上没有人用的时候执行,因为系统一直都有人在使用)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
10 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
岁岁年年
2012-04-09
打赏
举报
回复
系统业务数据有没有“时间戳”之类的标志来物理上减少需要抽取的数据量?这也是减轻ETL负担的一个方面了。
Leon_He2014
2012-04-09
打赏
举报
回复
建议弄个备份库,从备份库上做ETL
不要在生成库上做count统计
gudujianxiao
2012-04-09
打赏
举报
回复
1.在加载到目标表时,使用“快速加载”选项
2.在流程中避免使用完全阻塞任务;如Sort排序、聚合等转换功能。
3.排除不必要的字段。sql脚本不要使用 select * from 等等。
反正优化的地方很多。
gavinwwl
2012-04-08
打赏
举报
回复
我们已经在优化了,由于数据比较大,原来一次大概半个小时以上,现在已经优化到十几分钟,但是,在抽取时仍然会出现业务系统响应慢的情况. 公司对用户体验这一块看的比较重,一直比较头疼.....
Warren
2012-04-01
打赏
举报
回复
这确实是个问题,而且是所有DW ETL系统都面临的问题。
快速的抽取数据,快得不能再快的那种速度与Source断开连接,Source系统因为ETL的Exract过程而短时间的性能缺损是不可能避免的。唯一能做的,就是如何把这个时间缩短,而不能消除。
除考虑硬件扩展之外,考察一下数据增量,检测一下各种(那些表)数据抽取时间,重点优化那些耗时较长的数据抽取过程。
让你望见影子的墙
2012-04-01
打赏
举报
回复
1、没有历史数据库吗?
能不能做一个备用服务器,把一些历史数据放在这个备用服务器上,然后从这个备用服务器上作etl
唐诗三百首
2012-04-01
打赏
举报
回复
这的看ETL系统的功能是什么,数据抽取?
查看执行细节,尽量避免锁申请和全表扫描的方式,
系统应该有个相对闲时的吧,是相对比较闲.
gavinwwl
2012-04-01
打赏
举报
回复
[Quote=引用 2 楼 的回复:]
楼主的结贴率怎么那么高
[/Quote]
你不是第一个这么“关注”我的结贴率了,我也不知道,原来还是正常的,自从一次CSDN升级后就变成这样了,估计是Bug了。
迪迦凹凸曼
2012-03-31
打赏
举报
回复
楼主的结贴率怎么那么高
dawugui
2012-03-31
打赏
举报
回复
ETL是什么?没用过,不乱发言.
什么是
ETL
?
ETL
是做什么的?
ETL
,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。
ETL
是将
业务
系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,因而也称为数据仓库技术。其目的是将分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 可以看出,
ETL
要做三部分工作,数据抽取、数...
什么是
ETL
?
ETL
知识详解
阅读之前看这里????:博主是正在进行数据分析师求职的一员,博客记录的是在学习和求职过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。 博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。 目录1.
ETL
的定义2.数据的抽取(Extract)3.数据的清洗转换(Cleaning、Transform)4.
ETL
日志、警告发送5.
ETL
的几个特点, 1.
ETL
的定义
ETL
是将
业务
系统的数据经过
6-
ETL
-
ETL
日志
1、
ETL
日志
ETL
日志分为三类。一类是
执行
过程日志,这一部分日志是在
ETL
执行
过程中每
执行
一步的记录,记录每次运行每一步骤的起始时间,影响了多少行数据,流水账形式。一类是错误日志,当某个模块出错的时候写错误日志,记录每次出错的时间、出错的模块以及出错的信息等。第三类日志是总体日志,只记录
ETL
开始时间、结束时间是否成功信息。如果使用
ETL
工具,
ETL
工具会自动产生一些日志,这一类日志也可以...
ETL
代表什么?
ETL
开发主要做什么?
ETL
(Extract, Transform, Load)是数据处理中的关键流程,涉及从源系统提取数据、进行必要的转换和清洗,最后加载到目标系统。
ETL
在数据生态系统中扮演桥梁角色,连接数据源与数据仓库,为数据分析和决策支持提供基础。
ETL
开发的主要任务包括数据提取、转换和加载,每个步骤都需精心设计和
执行
,以确保数据的质量和一致性。然而,
ETL
开发面临数据质量、性能、安全和技术更新等挑战。为应对这些挑战,开发人员需采用先进的技术和策略,如数据清洗、并行处理、数据加密和持续学习。
ETL
是什么意思?一文讲清
ETL
流程全解析!
ETL
(提取、转换、加载)是数据处理流程中的关键环节,用于将分散的数据源整合并转化为高质量的数据资产。
ETL
的核心优势在于其强大的数据整合能力、数据质量提升以及灵活的
业务
适配性,但也存在开发维护成本高、性能瓶颈和处理延迟等局限性。
ETL
流程包括前期准备、核心处理和后期校验与优化三个阶段,涉及数据提取、转换和加载等步骤。
ETL
广泛应用于企业管理决策、金融风险管控、电商精准营销和医疗健康数据分析等多个领域,通过标准化和自动化的数据处理,帮助企业解决数据管理难题,提升运营效率和决策质量。
community_281
695
社区成员
253,703
社区内容
发帖
与我相关
我的任务
community_281
提出问题
复制链接
扫一扫
分享
社区描述
提出问题
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章