【实战】大数据架构师课程之--电商项目

东方不败耶耶耶 2016-11-23 04:55:40
加精
【讲师介绍】



【课程介绍】

目前无论是企业还是培训机构没有一家完整的大数据案例项目,本次课程将从数据产生---数据收集--数据分析---数据展示一步步带您走入大数据世界,让你感觉大数据并不是那么神秘 。
此大数据项目分为前端展示,系统搭建,数据分析,数据展示
前端展示用到技术:目前比较火的spring mvc和hibernate在servlet3.0规范下的纯注解编程体验
系统搭建用到技术:nginx服务器的负载均衡实现与动静分离技术中同tomcat服务器的服务器集群整合,以及系统层面的优化处理,比如立竿见影的cpu affinity进程分配技术以及粒度更细的cgroup实现资源隔离,
数据分析用到技术:从日志数据的产生,比如通过ab压力测试软件生产的海量日志消息,以及通过flume进行hop式跳跃推送进行kafka消息集群,同实现原生数据的hdfs下沉处理与MR实现的数据清洗过程后的数据转储。
分析展示层用到技术:使用hive与crontab组合实现网站流量的KPI数据定时统计。高可用方面配置独立的zk集群实现Hadoop的NN、RM以及利用storm实现业务数据的在线实时处理,结合hbase实现数据的实时读写。
通过以上流程让解决大部分公司常用的技术,里面不光有技术讲解,同时涉及了很多调优方案,让小白快速了解大数据做什么,让有基础的同学学到调优。


【课程特色】

1、课程注重实战,全程通过实战讲解,绝对干货。
2、课程体系比较强,里面不光有技术讲解,同时涉及了很多调优方案,让小白快速了解大数据做什么,让有基础的同学学到调优
3、购买全套课程的用户,可以进入专享学习交流群,随时沟通交流。
4、直播后提供视频回放+课件,反复学习和巩固知识。
5、在线问答+专属答疑课(每周一次),帮助学生实战运用。


【课程章节】

1. 项目概览
1.1 项目描述
1.2 核心技术说明
1.3 业务流程分析
1.4 项目整体架构图解

2.项目初始化
2.1 基于servler3.0 的web层框架准备
2.2 springmvc+spring+hibernate的基础类库实现

3. 大数据服务器配置
3.1nginx服务器反向代理配置
3.2nginx + tomcat实现动静资源隔离
3.3nginx实现日志滚动
3.4使用Apache ab进行压力测试

4. 大数据架构配置
4.1 部署flume和kafka集群
4.2 配置hive数据仓库,使用linux调度方式周期性生成分区表
4.3 利用spooldir source提取nginx滚动生成的日志文件到kafka集群
4.4 实现kafka消费者,数据分成两部分处理,一部分作为原生数据直接sink到hdfs,作为备份
4.5 另一部分进行数据清洗,并将清洗后的数据写入到hive数据库的分区表中

5. 大数据业务处理
5.1配置hbase集群,实现业务数据例如用户信息,订单信息等精准数据的存储和查询
5.2在hive中创建pv,uv等数据统计表,使用hbase存储处理器将数据映射到hbase中,以方便于快速查询和
数据可视化处理
5.3配置linux计划任务,周期性调用hive脚本,对上一天的日志信息进行kpi统计,统计结果进入hbase映射表中
5.4集合web前端部分,对hbase库中数据进行展现和可视化处理


【开课信息】

1、直播形式授课
2、上课时间:11.30号开课,每周三晚一节课(一共5节课)
3、上课时长:每周 1 小时左右,课程+互动+答疑


【课程报名链接】
http://huiyi.csdn.net/activity/product/goods_list?project_id=3289
...全文
6781 21 打赏 收藏 转发到动态 举报
写回复
用AI写文章
21 条回复
切换为时间正序
请发表友善的回复…
发表回复
H_Gragon 2016-12-12
  • 打赏
  • 举报
回复
我是csd_ner 2016-12-08
  • 打赏
  • 举报
回复
谢谢,学习到很多东西
willimwang 2016-12-08
  • 打赏
  • 举报
回复
谢谢
  • 打赏
  • 举报
回复
嘻哈愚者 2016-12-06
  • 打赏
  • 举报
回复
徐培成 十八掌教育创始人 主要讲 java,大数据
  • 打赏
  • 举报
回复
SSHorSSM 2016-11-30
  • 打赏
  • 举报
回复
搞得跟什么似的,培训机构吧
GWLCGL520 2016-11-30
  • 打赏
  • 举报
回复
报名 免费?
Jordan_Iverson 2016-11-29
  • 打赏
  • 举报
回复
望断雁南飞 2016-11-28
  • 打赏
  • 举报
回复
jiangliangtong 2016-11-28
  • 打赏
  • 举报
回复
ljheee 2016-11-27
  • 打赏
  • 举报
回复
GWLCGL520 2016-11-25
  • 打赏
  • 举报
回复
一直向往数据挖掘相关的职能,但是我数学不好有点担心呢~
  • 打赏
  • 举报
回复
  • 打赏
  • 举报
回复
赵4老师 2016-11-24
  • 打赏
  • 举报
回复
pl3121605999 2016-11-24
  • 打赏
  • 举报
回复
line_us 2016-11-24
  • 打赏
  • 举报
回复
走入大数据世界
中国风 2016-11-24
  • 打赏
  • 举报
回复
up一下
sych888 2016-11-23
  • 打赏
  • 举报
回复
加载更多回复(1)
上百节课详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍: 讲解一个真实的、复杂的大型企业级大数据项目,是Spark的大型项目实战课程。 通过本套课程的学习,可以积累大量Spark项目经验,迈入Spark高级开发行列。 课程特色: 1、项目中全面覆盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架几乎全部的初级和高级的技术点和知识点, 让学员学以致用,通过一套课程,即掌握如何将Spark所有的技术点和知识点应用在真实的项目中,来实现业务需求! 2、项目中的4个功能横块,全郃是实际企业项目中提取出来的,并进行技术整合和改良过的功能模块.全都是企业级的复杂和真实的需求,业务模块非常之复杂,绝对不是市面上的Dem级别的大数据项目能够想比拟的,学习过后,真正帮助学员增加实际 企业级项目的实战经验。 3、项目中通过实际的功能模块和业务场景,以及讲师曾经开发过的处理十亿、甚至百亿以上数据级别的SparK作业的经验积累,贯穿讲解了大量的高级复杂的性能调优技术和知识、troubleshooting解决线上报错和故障的经验、高端的全方位数据倾斜处理和解决方案.真正帮助学员掌握高精尖的Spark技术! 4、项目中采用完全还原企业大数据项目开发场景的方式来讲解,每一个业务模块的讲解都包括了需求分析、方案设计、数据设计、编码实现、功能测试、性能调优等环节,真实还原企业级大数据项目开发场景。 模块简介: 1、用户访问session分析,该模块主要是对用户访问session进行统计分析.包括session的聚合指标计算、 按时间比例随机抽取session、获取每天点击、下单和购买排名前10的品类、并获取top10品类的点击量排名前10的session.该模块可以让产品经理、数据分析师以及企业管理层形象地看到各种条件下的具体用户行为以及统计指标.从而对公司的产品设计以及业务发展战略做出调整.主要使用Spark Core实现. 2、页面单跳转化率统计,该模块主要是计算关键页面之间的单步跳转转化率,涉及到页面切片算法以及页面流匹配算法.该模块可以让产品经理、数据分析师以及企业管理层看到各个关键页面之间的转化率.从而对网页布局,进行更好的优化设计。主要使用Spark Core实现. 3、热门商品离线统计,该模块主要实现每天统计出各个区域的top3热门商品.然后使用Oozie进行离线统计任务的定时调度,使用Zeppeline进行数据可视化的报表展示.该模块可以让企业管理层看到公司售卖的 商品的整体情况,从而对公司的商品相关的战略进行调螫.主要使用Spark SQL实现。 4、广告流量实时统计.该模块负责实时统计公司的广告流量.包括广告展现流量和广告点击流量,实现动态黑名单机制以及黑名单过滤,实现滑动窗口内的各城市的广告展现流立和广告点击流直的统计,实现 每个区域诲个广告的点击流置实时统计,实现每个区域top3点击量的广告的统计,主要使用Spark Streaming实现.
2020人工智能与机器学习创新峰会PPT汇总,24个专题共73份资料。供大家学习参考。 一、测试新趋势 业务数据监控从0-1脱敏 AI在游戏数值与平衡性分析中的应用 微众研发效能改进之数据度量体系 敏捷测试团队转型实践 二、大规模机器学习算法 快速深度学习训练优化算法 三、高效运维 构建全链路数据度量体系、实现DevOps数据驱动闭环 既快又好 DevOps为小红书全员质量保障赋能 浙江移动AIOpsDev运维转型实践-脱敏版 四、工业4.0 AI赋能医药工业发展案例 五、机器学习框架 Volcano加速AI云原生迁移之路 基于分布式机器学习的通信网络资源协同优化和分配 如何做智能边缘计算 六、计算机视觉 深度学习Depth预测--在2d-to-3d项目中的应用 PaddleOCR产业实践之路:如何打造8.6M超轻量模型,一条龙解决训练部署问题 视觉问答与对话系统的新技术进展 视觉技术赋能高效淘宝素材质量巡检 七、架构演进 边缘计算的缘起、价值和实践 AI人脸识别应用技术方案选型与架构落地 爱奇艺 K8S GPU 共享虚拟化实践和优化 菜鸟运力平台架构演进 八、流式计算 美团点评实时计算平台 小米实时计算平台构建 超大规模 Flink 调度优化实践 九、落地"大中台"战略 有赞数据中台降本治理 演进式的大规模业务中台体系落地实践 京东B2B中台化实践A2M 十、企业级大数据架构演进 基于阿里云数据湖分析服务DLA快速构建数据湖解决方案 Delta Lake在实时数仓中的应用实践 滴滴数据平台建设实践 美图PB级大数据基础架构升级之路 十一、区块链 新基建下可信区块链网络建设 基于区块链的药品溯源体系建设 区块链+电子合同 确保效力 放飞效率 千里之堤溃于蚁穴 十二、数据库的未来 PB级结构化日志数据的高效处理 TBase多中心多活应用实践 使用 TiDB 列存引擎进行实时数据分析 十三、图神经网络、知识图谱 知识图谱在内容安全中的实践应用 百度事件图谱技术与应用 华为云知识图谱平台技术及案例分享 知识图谱在腾讯AI医疗的应用实践-脱敏版 十四、推荐系统 多模态内容理解在推荐系统的应用 小红书推荐系统的架构演进 知乎搜索排序模型实践 十五、微服务的2.0时代 如何优雅的步入微服务2.0时代(脱敏版) 微服务之后,分层架构该如何演进 微服务网关(2) 十六、云原生构建之路 从0到1构建云原生智能金融电商-脱敏版 Tars与k8s如何结合,助力阅文海外业务 云原生应用性能优化之道 Dubbo 基于 MOSN 在 Service Mesh 场景下的落地实践-曹春晖 十七、智慧金融 智慧金融的新基础设施-数据中台-A2M 自然语言处理在金融实时事件监测和财务快讯生成中的应用 联邦学习在金融安全领域的研究与应用 人工智能Fairness在金融行业的研究:基于Pipeline的方法 十八、智能数据分析 闲鱼纳米镜--人人都是数据分析师 大数据分析系统在游戏领域的实践 十九、智能语音 智能语音交互 面向自然交互的多模态人机交互解决方案 二十、AI基础设施建设 飞桨开源模型库与行业应用 基于飞桨的深度学习全流程开发实战 NLP定制化训练实践1.3 二十一、AIOps AItest 百度AIOps解决方案及行业落地案例--脱敏 邱化峰-使用AI从业务测试走向业务验证 面向人工智能的测试体系建设 - 脱敏 二十二、FinTech 恒生银行DevOps实践和探索 数字化转型:从内部一体走向内外一体 基于区块链的隐私支付分析与比较 二十三、IOT 数字化转型升级 AIoT在工业水处理中的应用和实践及对永续发展的意义 二十四、NLP 阿里小蜜DeepQA算法平台化大规模提效实践 多模态内容生成在京东商品营销中的探索与实践

590

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧