96_业务数仓_Sqoop导入数据

zhchzh1000 2023-01-12 18:50:14

课时名称课时知识点
96_业务数仓_Sqoop导入数据96_业务数仓_Sqoop导入数据
...全文
46 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
[数据仓库]基于⼤数据数仓和传统数仓的区别 ⽬录 基于⼤数据数仓 基于⼤数据数仓 随着新的应⽤场景(个性化推荐、⽤户画像、机器学习、数据分析、风控、精准运营)的出现,数据爆炸式增长,基于⼤数据数仓应⽤⽽ ⽣,其特点是业务变化快,速度快、能处理海量数据,有实时需求;ER建模被弱化、DWS、DM采⽤维度建模;建模被弱化,更偏于混合 建模,数据质量⼀般,关注需求速度快、灵活。更强调数据资产的重要性,⼀般到达⼀定规模,倾向与做数据治理(数据质量、数据安全、 数据标准、数据⾎缘、主数据、元数据管理) 1. 实效性⾼ 2. 业务灵活、多变 3. 数据源多样性 4. 数据质量参差不齐 5. 应⽤场景复杂 技术栈:HDFS、Hive、Hbase、Flume、Kafka、Flink、Spark、Sqoop、ES、oozie等 传统数仓 传统数仓 传统数仓建有较稳定的业务场景和相对可靠的数据质量,同时也有相对稳定的需求,对数仓建设有较为完善的项⽬管控流程,数据建模有较 严格、稳定的建设标准;但是建设周期长,处理的数据结构单⼀,处理复杂数据成本⾼,只要⽀持数据分析和管理决策。 DWD⼀般采⽤ER建模、DWS、DM采⽤维度建模,数据质量⾼。 技术栈:TD、Oracle 传统数仓和基于⼤数据数仓的相同点 传统数仓和基于⼤数据数仓的相同点 1、分层架构 2、ER、维度建模理论同样适⽤ 3、数据服务体系⼀般都有BI、指标系统

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • zhchzh1000
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧