社区
Hadoop生态社区
帖子详情
Hbase能做到随机读取部分数据么?
whos2002110
2014-06-30 03:32:43
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据,
或者随机取1W条数据
...全文
437
2
打赏
收藏
Hbase能做到随机读取部分数据么?
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据, 或者随机取1W条数据
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
whos2002110
2014-07-02
打赏
举报
回复
引用 1 楼 herofour444 的回复:
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
嗯, 我看到有个RandomRowFilter, 这个基本可以满足我的需求了
herofour444
2014-07-02
打赏
举报
回复
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
hbase
高性能
读取
数据
有时需要从
Hbase
中一次
读取
大量的
数据
,同时对实时性有较高的要求。可以从两方面进行考虑: 1、
hbase
提供的get方法提供了批量获取
数据
方法,通过组装一个list gets即可实现; 2、Java多线程的Future方法实现了如何...
HBase
的
随机
读写
最近在学习大
数据
相关的知识,学到了
HBase
,对其中的
随机
实时读写不是很明白,从网上翻了翻文章,有两篇不错的,粘贴过来分享给大家。 第二篇文章在这: ...
Hbase
为什么支持
随机
读写
Hbase
为什么支持
随机
读写 基于HDFS,HDFS只支持追加写,不支持
随机
写!
随机
读写: 本质上还是追加写,基于版本号,实现
随机
写 append + 版本控制 update + delete :
随机
写 insert : 追加写 默认只返回时间戳...
为什么
Hbase
能实现快速的查询
A:如果快速查询(从磁盘读
数据
),
hbase
是根据rowkey查询的,只要能快速的定位rowkey, 就能实现快速的查询,主要是以下因素: 1、
hbase
是可划分成多个region,你可以简单的理解为关系型
数据
库的多个分区。 2、键是...
HBase
海量业务
数据
二级查询实现毫秒级响应,
HBase
原理与
数据
模型设计详解
为什么需要使用
HBase
做海量业务
数据
的存储 ...3、高性能,由于底层的LSM
数据
结构和RowKey有序排序,
HBase
具备较好的
随机
读取
性能,RowKey的查询可达毫秒级响应 4、稀疏性、面向列存储,空列不...
Hadoop生态社区
20,846
社区成员
4,695
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章