社区
Hadoop生态社区
帖子详情
Hbase能做到随机读取部分数据么?
whos2002110
2014-06-30 03:32:43
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据,
或者随机取1W条数据
...全文
424
2
打赏
收藏
Hbase能做到随机读取部分数据么?
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据, 或者随机取1W条数据
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
whos2002110
2014-07-02
打赏
举报
回复
引用 1 楼 herofour444 的回复:
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
嗯, 我看到有个RandomRowFilter, 这个基本可以满足我的需求了
herofour444
2014-07-02
打赏
举报
回复
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
hbase
高性能
读取
数据
有时需要从
Hbase
中一次
读取
大量的
数据
,同时对实时性有较高的要求。可以从两方面进行考虑: 1、
hbase
提供的get方法提供了批量获取
数据
方法,通过组装一个list gets即可实现; 2、Java多线程的Future方法实现了如何从多线程中获取返回
数据
。以上两种方法结合后,获取
数据
将会更加的高效。阅读到一篇文章,对这两 个方法的结合使用给出了实例,并有详细的性能分析。特意转载过来,供
HBase
的
随机
读写
最近在学习大
数据
相关的知识,学到了
HBase
,对其中的
随机
实时读写不是很明白,从网上翻了翻文章,有两篇不错的,粘贴过来分享给大家。 第二篇文章在这: https://blog.csdn.net/weixin_42771366/article/details/120396428https://blog.csdn.net/weixin_42771366/article/details/120396428 第一篇原文地址: Apache
HBase
I/O - HFile - Cloudera...
Hbase
为什么支持
随机
读写
Hbase
为什么支持
随机
读写 基于HDFS,HDFS只支持追加写,不支持
随机
写!
随机
读写: 本质上还是追加写,基于版本号,实现
随机
写 append + 版本控制 update + delete :
随机
写 insert : 追加写 默认只返回时间戳最大的
数据
! key value timestamp r1:cf1:name 20 16011 r1:cf1:name 30 16014 r1:cf1:name Delete 16015 ...
【原创】
HBase
如何实现海量
数据
的毫秒级查询
HBase
中单表的
数据
量通常可以达到TB级或PB级,但大多数情况下
数据
读取
可以做到毫秒级。
HBase
是如何做到的哪?要想实现表中
数据
的快速访问,通用的做法是
数据
保持有序并尽可能的将
数据
保存在内存里。
HBase
也是这样实现的。 对于海量级的
数据
,首先要解决存储的问题。
数据
存储上,
HBase
将表切分成小一点的
数据
单位region,托管到RegionServer上,和以前关系
数据
库...
为什么
Hbase
能实现快速的查询
为什么
Hbase
能实现快速的查询 你的快速是指什么? 是根据亿级的记录中快速查询,还是说以实时的方式查询
数据
。 A:如果快速查询(从磁盘读
数据
),
hbase
是根据rowkey查询的,只要能快速的定位rowkey, 就能实现快速的查询,主要是以下因素: 1、
hbase
是可划分成多个region,你可以简单的理解为关系型
数据
库的多个分区。 2、键是排好序了的 3、按列存储的 首先,能快速找到行所在的region(分区),假设表有10亿条记录,占空间1TB, 分列成了500个region, 1个regio
Hadoop生态社区
20,848
社区成员
4,696
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章