读后感

weixin_99 2019-04-18 01:55:59
读谷歌的的三篇论文,让我对文件系统管理和数据分析有了新认识。了解到当一份文件同时被大量用户访问时,文件会出现问题;并且有的文件本身很大,管理起来不容易;绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据的方式。这些问题导致了整个系统不太灵活。于是谷歌针对这些问题,部署了多套 GFS 集群。最大的一个集群拥有超过 1000 个存储节点,这样可以被不同机器上的许多个用户端连续不断的频繁访问。在设计的过程中,想到会遇到大文件和小文件,所以系统也必须支持小文件,但是不需要针对小文件做专门优化。因此谷歌设计了系统的工作,主要由两种读操作组成:大规模的流式读取和小规模的随机读取。这使系统更加高效。除此,GFS 提供了一套类似传统文件系统的 API 接口函数,还提供了快照和记录追加操作功能,可以以很低的成本创建一个文件或者目录树的拷贝,并且还可以允许多个客户端同时对一个文件进行数据追加操作。并且这个构建可以接受不可靠的应用程序代码带来的稳定性降低的风险。除此,因为元数据保存在内存中,所以 Master 服务器的操作速度非常快,这样增强了系统的简洁性、可靠性、高性能和灵活性。谷歌文件系统管理,成功的实现了人们对存储的需求。 而大数据是分布式的结构化数据存储系统,它被设计用来处理海量数据。利用这个模型,用户可以动态的控制数据的分布和格式。其运用范围很广,适用于生活方方面面,并且其效果十分重要,通过分析收集的数据,可以反映出很多问题。大数据的数据模式是通过行、列族、时间戳、API来分析数据。 作为一名文科生,现在又再学英语专业的学生来说,完全不太懂计算机,看着三篇论文非常困难,但总体来说,读完后感觉谷歌基于平时生活应用中的一些问题,设计更加优化的系统(程序),在中间过程中也出现很多问题,但都一一克服了。计算机真的好难,术语、概念难,其实感觉计算机也是一种语言,其难度比英语和二外的语法还难。但谷歌设计的文件管理和大数据在生活中可以有很广泛的运用,其以后可以将学生的成绩存档,并且分析学生的问题。便于老师更好的讲授重难点。
...全文
14 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

488

社区成员

发帖
与我相关
我的任务
社区描述
硬件使用 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧