关于大数据的学习路线问题

Bonsour 2017-09-19 12:45:05

计划想学习大数据，不知道如何下手。请各位大数据工作的讲解一下，大数据工作内容主要是做什么。大数据学习基本路线是什么。除了主要的内容之外，还需要备用哪些知识。

...全文

1091 9 打赏收藏转发到动态举报

写回复

用AI写文章

9 条回复

切换为时间正序

请发表友善的回复…

发表回复

Bonsour 2018-01-23

打赏
举报

引用 7 楼 walykyy 的回复:

赶紧先买本Hadoop权威指南4中文版先看看吧，我也是刚买了书

谢谢，老早之前提的问题了，现在已经基本入门了。接下来要做的就是发现他的用途，了解了解它的底层实现。

Bonsour 2018-01-23

打赏
举报

引用 4 楼 dinghun8leech 的回复:

大数据东西挺多，关键还看需求和目标。大数据主要包含两类东西：分布式存储（如hdfs）和分布式计算（如mr、spark），计算里面细分为批处理计算（如mr）和流式计算（如storm）。以hadoop技术栈为例，hdfs肯定要了解，其他的看需求。计算框架可以看看spark，利用内存计算，减少落地次数，号称可以淘汰mr。最近还有比较热门的海量日志处理，常见技术是flume、kafka、elk等，flume与hadoop技术栈兼容，kafka依赖zk，elk是集群化的lucene加采集和展现。备用知识比较重要的，一是linux，一是网络基础，最好还要有一定开发经验。大数据和小数据一样，核心就两样：数据的存储和运算，只是搞成了分布式而已，当然，分布式带来了许多新的问题和挑战。

谢谢

与自己作战 2018-01-16

打赏
举报

赶紧先买本Hadoop权威指南4中文版先看看吧，我也是刚买了书

善若止水 2017-12-17

打赏
举报

个人建议你可以去某个培训机构的官网上下载个视频，看看大数据的学习之路。比如尚什么堂，传什么博客之类的（名称不写全，免得被认为是做广告的，你自己百度吧），北京这样的培训机构很多的。他们的官网上都有免费的视频供下载，并且是因为做宣传的，讲课的质量都比较高。希望对你有用

dinghun8leech 2017-12-01

打赏
举报

大数据东西挺多，关键还看需求和目标。大数据主要包含两类东西：分布式存储（如hdfs）和分布式计算（如mr、spark），计算里面细分为批处理计算（如mr）和流式计算（如storm）。以hadoop技术栈为例，hdfs肯定要了解，其他的看需求。计算框架可以看看spark，利用内存计算，减少落地次数，号称可以淘汰mr。最近还有比较热门的海量日志处理，常见技术是flume、kafka、elk等，flume与hadoop技术栈兼容，kafka依赖zk，elk是集群化的lucene加采集和展现。备用知识比较重要的，一是linux，一是网络基础，最好还要有一定开发经验。大数据和小数据一样，核心就两样：数据的存储和运算，只是搞成了分布式而已，当然，分布式带来了许多新的问题和挑战。