社区
Hadoop生态社区
帖子详情
关于软件杯“基于互联网大数据的招聘数据智能分析平台”这个赛题
路飞y
2019-03-25 07:32:15
引入: 因为我本专业祝学的java,对大数据这方面并没有涉及过。在经过两天的学习之后对Linux基础与Python基础有了一定的了解。 一、在数据收集阶段,到底是用Python对数据进行处理还是直接用mr 切片然后存到hive去。 二、在数据分析阶段有没有什么更方便的组件可以对数据进行处理,挖掘与建模。 三、在数据展示阶段,有什么哪些适合新手的可视化工具。
...全文
217
4
打赏
收藏
关于软件杯“基于互联网大数据的招聘数据智能分析平台”这个赛题
引入: 因为我本专业祝学的java,对大数据这方面并没有涉及过。在经过两天的学习之后对Linux基础与Python基础有了一定的了解。 一、在数据收集阶段,到底是用Python对数据进行处理还是直接用mr 切片然后存到hive去。 二、在数据分析阶段有没有什么更方便的组件可以对数据进行处理,挖掘与建模。 三、在数据展示阶段,有什么哪些适合新手的可视化工具。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
nbhong1
2019-11-18
打赏
举报
回复
有这个赛题报告么
振东主机
2019-04-29
打赏
举报
回复
学习,关注!
路飞y
2019-03-26
打赏
举报
回复
萌新程序员,求大佬给点意见
4qw
2019-03-26
打赏
举报
回复
zeeplin,基于spark;可以的话也用tableau,要收费的; 也可以spark计算数据将数据保存到elastisearch,然后使用kibana连接elasticsearch查看.
基于阿里天池大赛学习赛的天猫复购预测案例,基于
赛题
搭建的Hadoop+spark
平台
上进行项目设计实现+源代码+文档说明+
数据
集
本项目基于阿里天池
大
数据
竞赛的天猫复购预测学习赛,基于
赛题
,我们首先对
数据
进行
分析
和可视化并得出结论,然后从
数据
集中提取可能对预测标签有影响的特征形成新的训练集,然后搭建了Hadoop+spark集群进行算法设计实现,通过运用预测模型算法,
分析
挖掘所提供的
数据
,预测消费者会复购,成为忠实、粘性客户的可能 -------- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工
智能
、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
2020“东方国信
杯
”高校
大
数据
开发大赛最终榜第三名思路分享
2020“东方国信
杯
”高校
大
数据
开发大赛季军思路分享 2020“东方国信
杯
”高校
大
数据
开发大赛刚刚结束,我所在的队伍“三人运动团”最后取得了3/453 这个还算不错的成绩。感谢两位大佬队友的一路相伴!!下面我将分享一下我们本次比赛的一点思路! 写在前面:大家好!我是练习时长半年的在读本科生
数据
小白JerryX,各位
数据
挖掘大佬有什么问题和建议多多指教!!欢迎大家多多点赞,多多评论,多多批评指正!! 目录2020“东方国信
杯
”高校
大
数据
开发大赛季军思路分享0
赛题
背景1 特征工程2 模型策略3 结论&a
年度顶级赛事来袭:2023 CCF
大
数据
与计算
智能
大赛首批
赛题
上线!
年度顶级赛事强势来袭,首批
赛题
重磅上线! 2023 CCF BDCI 大赛,等你挑战!
2019第八届“中国软件
杯
”大学生软件设计大赛
赛题
有哪些?
近日,第八届“中国软件
杯
”大学生软件设计大赛
赛题
工作已经完成并发布,众所周知,“整个赛程采用的
赛题
原型全部来源于全国软件百强企业的实际技术需求,这些来源于现实的“关卡”,旨在让众多热爱软件设计的学生更加充分地展现自我,从实战中快速获得提升。那么第八届“中国软件
杯
”大学生软件设计大赛
赛题
有哪些?今天课工场就和大家聊聊! 本科组: 1、基于深度学习的银行卡号识别系统 2、基于计算机视觉的辅助自动驾驶应...
2011-2022年高职
大
数据
竞赛-
赛题
内容
本系列共分五篇,内容分别为: 第一部分
赛题
内容 第二部分 任务剖析 第三部分
赛题
模拟实现-离线
数据
抽取 第四部分
赛题
模拟实现-离线
数据
统计 第五部分
赛题
模拟实现-
数据
采集与实时计算 第六部分
赛题
模拟实现-
数据
可视化 第一部分 竞赛内容 赛项以
大
数据
技术与应用为核心内容和工作基础,重点考查参赛选手基于Spark、Flink
平台
环境下,充分利用Spark Core、Spark SQL、Flume、Kafka、Flink等技术的特点,综合软件开发相关技术,解决实际问题的能力,具体包括:
Hadoop生态社区
20,807
社区成员
4,690
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章