社区
杨俊的课程社区_NO_5
【完整】Flink大数据实时仓库项目实战
帖子详情
124.搭建实时数仓DWS层-每日用户进程行为(5)
俊哥大数据
2024-12-27 17:04:32
课时名称
课时知识点
124.搭建实时数仓DWS层-每日用户进程行为(5)
124.搭建实时数仓DWS层-每日用户进程行为(5)124.搭建实时数仓DWS层-每日用户进程行为(5)
...全文
52
回复
打赏
收藏
124.搭建实时数仓DWS层-每日用户进程行为(5)
课时名称课时知识点124.搭建实时数仓DWS层-每日用户进程行为(5)124.搭建实时数仓DWS层-每日用户进程行为(5)124.搭建实时数仓DWS层-每日用户进程行为(5)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
大数据技术之高频面试题8.0.8(1)(1).docx
大数据技术之高频面试题8.0.8(1)(1).docx
Flink
实时
数仓
-03-
DWS
层
搭建
设计要点:(1)
DWS
层
的设计参考指标体系;(2)
DWS
层
表名的命名规范为
dws
_数据域_统计粒度_业务过程_统计周期(window)注:window 表示窗口对应的时间范围。主要任务从 Kafka 页面浏览明细主题读取数据,过滤搜索
行为
,使用自定义 UDTF(一进多出)函数对搜索内容分词。统计各窗口各关键词出现频次,写入 ClickHouse。思路分析本程序将使用 FlinkSQL 实现。分词是个一进多出的过程,需要一个 UDTF 函数来实现,FlinkSQL 没有提供相关的内置函数,所以要自定义 UDT
Flink
实时
数仓
-02-DWD
层
搭建
(1)DataStream方式});});} });} }这种方式的缺点是只有inner join。(2)SQL方式});});//将流转换为动态表 tableEnv . createTemporaryView("t1" , waterSensorDS1);
Flink电商
实时
数仓
项目01-ODS
层
Flink电商
实时
数仓
项目 - 数据采集 1 电商
实时
数仓
项目概述 1.1 数据分
层
分析 离线
数仓
项目的分
层
为: ODS、DWD、
DWS
、DWT、ADS flink
实时
数仓
项目的分
层
为: ODS、DWD、DIM、DWM、
DWS
、ADS 其中ODS
层
为原始数据
层
;DWD
层
详细数据
层
,根据数据对象为单位进行分流,比如订单、页面访问等;DIM
层
维度数据
层
;DWM
层
对部分数据对象进一步加工,比如独立访问、跳出
行为
,也可以与维度进行关联,形成宽表,依旧是明细数据;
DWS
层
根据某个主题将多个
实时
数据轻度聚合,
【学习笔记】尚硅谷大数据项目之Flink
实时
数仓
---DWM
层
DWM
层
部分的代码主要的责任,是通过计算把一种明细转变为另一种明细以应对后续的统计。学完本阶段内容要求掌握
杨俊的课程社区_NO_5
2
社区成员
637
社区内容
发帖
与我相关
我的任务
杨俊的课程社区_NO_5
1.自我介绍 杨俊 大数据高级工程师 15年开发经验,10年大数据从业经验 擅长Hadoop、Spark、Flink等主流大数据技术 51cto单个平台拥有35万粉丝 2.授课经验 中国移动、新华三(H3C)等企业内训经验 首经贸大学、河北燕大等高校师生培训经验 3.个人成就 著书《大数据开发工程师面试笔试宝典》、《实战大数据(Hadoop+Spark+Flink)》、《Hadoop大数据技术基础及应用》、《实战大数据-分布式大数据分析处理系统开发与应用》 技术咨询与交流vx:dashuju_2017
复制链接
扫一扫
分享
社区描述
1.自我介绍 杨俊 大数据高级工程师 15年开发经验,10年大数据从业经验 擅长Hadoop、Spark、Flink等主流大数据技术 51cto单个平台拥有35万粉丝 2.授课经验 中国移动、新华三(H3C)等企业内训经验 首经贸大学、河北燕大等高校师生培训经验 3.个人成就 著书《大数据开发工程师面试笔试宝典》、《实战大数据(Hadoop+Spark+Flink)》、《Hadoop大数据技术基础及应用》、《实战大数据-分布式大数据分析处理系统开发与应用》 技术咨询与交流vx:dashuju_2017
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章