HDFS不太适合做大量的随机读应用，但HBASE却特别适合随机的读写，HBASE是怎么协调的？

直播小助理 2016-09-20 05:35:39

HDFS不太适合做大量的随机读应用，但HBASE却特别适合随机的读写，HBASE是怎么协调的？

...全文

2215 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

icesnow330 2016-10-12

打赏
举报

回复

个人理解数据库一般都会有一层缓存，任何对数据的更改实际上是先更改内存中的数据。然后有异步的守护进程负责将脏页按照一定策略刷新到磁盘空间中去。这就可以大大降低软件对于磁盘随机操作的频度。

HDFS不太适合做大量的随机读应用，但HBASE却特别适合随机的读写个人理解： 1、数据库一般都会有一层缓存，任何对数据的更改实际上是先更改内存中的数据。然后有异步的守护进程负责将脏页按照一定策略刷新到磁盘空间中去。这就可以大大降低软件对于磁盘随机操作的频度。 2、HDFS读取会进行全文件查找耗时相当大，而数据库通常会建索引查找起来就快。...

虽然HDFS本身不支持随机读写，但是HBase通过其自身的结构和实现方式，可以在HDFS之上实现高效的随机读写特性。（1）基于hadoop, 和 HDFS是一种强依赖关系, HBase的吞吐量不是特别高, 支持高效的随机读写特性（即：大型表提供快速记录查找(和更新)）为。2.Hive可以用来进行统计查询，HBase可以用来进行实时查询，数据也可以从Hive写到HBase，或者从HBase写回Hive。8. 面对大量的企业数据，HBase可以直线单表大量数据的存储，同时提供了高效的数据访问速度。

hbase的随机读写

Hbase为什么支持随机读写基于HDFS，HDFS只支持追加写，不支持随机写！随机读写：本质上还是追加写，基于版本号，实现随机写 append + 版本控制 update + delete : 随机写 insert : 追加写默认只返回时间戳最大的数据！ key value timestamp r1:cf1:name 20 16011 r1:cf1:name 30 16014 r1:cf1:name Delete 16015 ...

一直疑惑Hbase怎么更新hdfs文件。因为HBase是一个支持高并发随机读写的数据库，而hdfs只适合于大批量数据处理，hdfs文件只能写一次，一旦关闭就再也不能修改了。而HBase却将数据存储在hdfs上！让人费解。原来的猜想是Hbase每次将更新写入磁盘都会创建一个新的hdfs文件，存放该数据旧版本的文件需要合并并最终丢弃，如果是这样的话，其随机读写的性能如何保证？在网上找到了两篇文章很

744

社区成员

901

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章