社区
徐传林的课程社区_NO_1
高性能高扩展的亿级电商全端实时数据仓库全实现(PC、移动、小程序)
帖子详情
121、实时数据仓库之app应用层终端使用类别分析sql编写
youfanedu
2023-01-13 03:17:17
课时名称
课时知识点
121、实时数据仓库之app应用层终端使用类别分析sql编写
121、实时数据仓库之app应用层终端使用类别分析sql编写
...全文
22
回复
打赏
收藏
121、实时数据仓库之app应用层终端使用类别分析sql编写
课时名称课时知识点121、实时数据仓库之app应用层终端使用类别分析sql编写121、实时数据仓库之app应用层终端使用类别分析sql编写
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
基于Flink+Doris构建高性能高扩展的全端
实时
数据仓库
教程
课程总体架构请观看89讲。
数据仓库
是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。
数据仓库
的
应用
有:1.数据
分析
、数据挖掘、人工智能、机器学习、风险控制、无人驾驶。2.数据化运营、精准运营。3.广告精准、智能投放等等。
数据仓库
是伴随着企业信息化发展起来的,在企业信息化的过程中,随着信息化工具的升级和新工具的
应用
,数据量变的越来越大,数据格式越来越多,决策要求越来越苛刻,
数据仓库
技术也在不停的发展。
数据仓库
有两个环节:
数据仓库
的构建与
数据仓库
的
应用
。随着IT技术走向互联网、移动化,数据源变得越来越丰富,在原来业 务数据库的基础上出现了非结构化数据,比如网站log,IoT设备数据,
APP
埋点数据等,这些数据量比以往结构化的数据大了几个量级,对ETL过程、存储都提出了更高的要求。互联网的在线特性也将业务需求推向了
实时
化 ,随时根据当前客户行为而调整策略变得越来越常见,比如大促过程中库存管理,运营管理等(即既有中远期策略型,也有短期操作型)。同时公司业务互联网化之后导致同时服务的客户剧增,有些情况人工难以完全处理,这就需要机器 自动决策 。比如欺诈检测和用户审核。总结来看,对
数据仓库
的需求可以抽象成两方面:
实时
产生结果、处理和保存大量异构数据。本课程基于真实热门的互联网电商业务场景为案例讲解,结合分层理论和实战对数仓设计进行详尽的讲解,基于Flink+DorisDB实现真正的
实时
数仓,数据来及
分析
,
实时
报表
应用
。具体数仓报表
应用
指标包括:
实时
大屏
分析
、流量
分析
、订单
分析
、商品
分析
、商家
分析
等,数据涵盖全端(PC、移动、小程序)
应用
,与互联网企业大数据技术同步,让大家能够学到大数据企业级
实时
数据仓库
的实战经验。本课程包含的技术: 开发工具为:IDEA、WebStorm Flink 1.11.3Hadoop 2.7.5Hive 2.2.0ZookeeperKafka 2.1.0、Spring boot 2.0.8.RELEASESpring Cloud Finchley.SR2Flume 、Hbase 2.2.6DorisDB 0.13.9、RedisVUE+jQuery+Ajax+NodeJS+ElementUI+Echarts+Datav等课程亮点: 1.与企业接轨、真实工业界产品2.DorisDB高性能分布式数据库3.大数据热门技术Flink最新版4.真正的
实时
数仓以及分层设计5.海量数据大屏
实时
报表6.数据
分析
涵盖全端(PC、移动、小程序)
应用
7.主流微服务后端系统8.数据库
实时
同步解决方案9.涵盖主流前端技术VUE+jQuery+Ajax+NodeJS+ElementUI+Echarts+Datav10.集成SpringCloud实现统一整合方案11.互联网大数据企业热门技术栈12.支持海量数据的
实时
数仓报表
分析
13.支持全端
实时
实时
数仓报表
分析
14.全程代码实操,提供全部代码和资料 15.提供答疑和提供企业技术方案咨询企业一线架构师讲授,代码在老师的指导下企业可以复用,提供企业解决方案。 版权归作者所有,盗版将进行法律维权。
大数据新时代:基于Flink的
实时
数仓架构-学习笔记(中)
目录 离线
数据仓库
实时
数据仓库
离线
数据仓库
ODS:原始数据 DWD:详细数据 DWS/DM:数据汇总层/数据集市层data marker
APP
/ADS:数据
应用
层
实时
数据仓库
但是会遇到一些问题,什么问题呢? 这是
实时
数仓就进场了: ...
Impala快速入门
一.简介 Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式
SQL
查询功能。基于Hive
使用
内存计算,兼顾
数据仓库
,具有
实时
、批处理、多并发的优点。是CDH平台首选的PB级大数据
实时
查询
分析
引擎。 二.优点 1.基于内存计算,能够对PB级别数据进行交互式
实时
查询、
分析
2.无需转化MR,直接读取HDFS数据 3.C++
编写
,LLVM...
Apache Kylin基本原理与常见优化
一、基本原理 Apache Kylin是个开源分布式OLAP引擎。 Kylin一般是作为
数据仓库
的
应用
层引擎,对业务提供
SQL
查询
分析
服务,针对数据维度多、数据基数大的场景,Kylin预计算可以保证在毫秒级时间返回
分析
结果,查询阶段性能十分出众。 Kylin的相关人员主要分为三种角色:1. 数据用户 2.
数据仓库
建模人员 3. 数据平台管理员。数据用户通过BI可视化
分析
工具或者
编写
SQL
查询Kylin的数据;
数据仓库
建模人员维护Kylin元数据,设计如何构建Cube,选择维度、度量;数据平台管理员提供存
徐传林的课程社区_NO_1
1
社区成员
855
社区内容
发帖
与我相关
我的任务
徐传林的课程社区_NO_1
复制链接
扫一扫
分享
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章