请教用于存储大量小文件的方案

visulcer 2015-08-03 11:27:13

我的情况是要存储大量10K到10M的文件，总大小7T，以后还要不断增加，也会删除一些文件，我想到的最简单的办法就是直接存在Windows NTFS文件系统里，这样会有什么缺点？

总觉得存这么多的小文件不好，然后，我想到了利用lucene，不做索引，只存储，利用lucene的段合并功能，把文件合并在一起，lucene还会帮我压缩数据，但这样明显会增加至少10几倍的磁盘读写，而且lucene有缓存机制，万一出了什么差池，缓存flush到磁盘时失败了，那不是会造成数据不一致了吗？那我还要做这些善后工作。。。

然后，听说hadoop的分布式文件系统有多强大，为了这，我又大概看了一下hadoop，但发现hadoop最终存的还是一个一个的文件，而且就是原文，那还不如直接NTFS了，我还没深入了解hadoop，不知道hadoop能不能把大量小文件放在一个大的容器里处理？但我又有个疑问，hadoop最终存的还是一个一个的文件，但一个目录里的文件数量是有限制的，达到上限后，我们、hadoop要怎么做？

...全文

859 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

visulcer 2015-08-05

打赏
举报

回复

好像mongodb不错啊

微信小程序系统教程[初级阶段]，微信小程序0基础学起，讲解微信小程序开发的基础知识。微信小程序系统教程共有“微信小程序系统教程[初级阶段]”、“微信小程序系统教程[中级阶段]——核心技术”、“微信小程序...

请教关于php运行速度与文件大小的问题关注:197答案:4手机版解决时间 2021-01-31 14:25提问者北墓南笙2021-01-30 14:14我有个php执行文件，里面有个变量(字符串)很长，长到这个字符串大概是30000个字节，我开始是把这...

它分布在多个计算机节点上面，每个节点只会存储整个文件的一部分内容，它有多重备份，易于部署，方便扩容等诸多的优点，而且它能够统一接口，使用它就像使用普通的文件系统一样，而且它对小文件的处理，性能优秀。...

文件管理是一个困扰着我的问题。从高中起，我就开始意识到一点，我高中的文件管理方式太低效。做了无数张卷子，收集了好几个错题本，写了好几十万字的日记，看似认真踏实，实际上低效愚蠢。因为我的这些工作相互...

在实际工作中，为了更好地引入分布式存储技术，我们需了解各种分布式存储技术的特点，以及各种技术的适用场景，在此希望请教下同行，城商行应该如何选择这些分布式存储技术，他们各自的特点和场景如何？在以

932

社区成员

652

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章