说说hadoop在你们的项目中扮演什么角色/起到什么作用?
打算转行进入大数据/数据挖掘/人工智能领域,在大数据领域yhadoop是绕不过的话题。因为不太熟悉,也没有做过实际项目,只是搭过一主二从的简单集群,运行过一个hello的 map reduce程序,所以对hadoop的认识还不深,有困惑还没解开。
招聘中要求的会hadoop 主要指的是什么?是hadoop的map reduce 将大数据的运算 分配到多个主机上并行处理吗 还是 hadoop 的分布式文件系统,做存储数据用?
说说真实的项目中(你们自己的项目中),hadoop 主要承担哪些功能的? 最好能给我详细讲讲,包括hadoop配套的其他软件框架呀之类。
初学老萌新,望大家多多指教,谢谢大家