社区
Informatica
帖子详情
大数据处理/Hadoop与数据挖掘
shidan473414
2015-10-26 09:59:10
新人一枚,刚开始学习这方面的东西,我的问题是:
1. 大数据处理 与数据挖掘的关系?他们之间是一个东西吗?
2. Hadoop是干什么用的,这与大数据和数据挖掘有什么关联?
3.学习这方面的学习路线是什么?
谢谢 各位大牛帮我解释下。
...全文
1993
1
打赏
收藏
大数据处理/Hadoop与数据挖掘
新人一枚,刚开始学习这方面的东西,我的问题是: 1. 大数据处理 与数据挖掘的关系?他们之间是一个东西吗? 2. Hadoop是干什么用的,这与大数据和数据挖掘有什么关联? 3.学习这方面的学习路线是什么? 谢谢 各位大牛帮我解释下。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
眉眼风流是小爷
2015-12-02
打赏
举报
回复
大数据处理分很多步骤,数据挖掘只是其中的一部分,刚开始学习需要一些系统性的知识垫垫底,推荐你一个数据科学在线学习的平台,叫数析学院(http://datacademy.io),上面课程比较基础不会很难学但是课程内容很棒,而且全部免费。学习过以后相信你一定会有收获。
大数据概述 ///
hadoop
集群搭建 ///
Hadoop
配置JobHistory ///
Hadoop
常用端口号
二、
hadoop
生态系统2.1
hadoop
2.0 框架2.2
hadoop
的概念官网定义:
hadoop
可以分为狭义和广义两种:2.3
hadoop
生态系统中主要部件的介绍:Flume(日志收集工具)2.4
hadoop
的三大核心组件HDFS架构HDFS写数据流程HDFS...
Hadoop
教程(一)
Hadoop
入门教程
Hadoop
是Apache开源组织的一个分布式计算开源框架(http://
hadoop
.apache.org/),用...数据在
Hadoop
中处理的流程可以简单的按照下图来理解:数据通过Haddop的集群处理后得到结果,它是一个高性能处理海量数据集的工具 。
Hadoop
安装部署详细说明
高可靠性:
Hadoop
底层维护多个数据副本,即使
Hadoop
某个计算程序或存储出现故障,也不会导致数据的丢失。 高扩展性:在集群之间分配任务数据,可方便的扩展数以千计的节点。 高效性:在 MapReduce 的思想下,...
大数据技术原理与应用----大
数据处理
架构
Hadoop
(1)HDFS:分布式文件存储;(2)YARN:底层的资源调度管理;(3)MapReduce:离线计算,基于磁盘(一般不...(7)Pig:轻量级分析,流
数据处理
;(8)Oozie:作业调度系统;(9)Zookeeper:分布式协调一致式服务;
Chapter2 大
数据处理
架构
Hadoop
2.1
Hadoop
简介和版本演变 2.1.1
Hadoop
简介
Hadoop
是Apache软件基金会旗下开源软件,为用户提供高层接口,为用户提供了底层细节...这两大核心共同解决了大数据的两大问题:海量数据的分布式存储、海量数据的分布式处理
Informatica
246
社区成员
377
社区内容
发帖
与我相关
我的任务
Informatica
讨论 Informatica 数据集成相关技术、数据隐私保护相关技术
复制链接
扫一扫
分享
社区描述
讨论 Informatica 数据集成相关技术、数据隐私保护相关技术
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章