社区
Hadoop生态社区
帖子详情
Hbase能做到随机读取部分数据么?
whos2002110
2014-06-30 03:32:43
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据,
或者随机取1W条数据
...全文
442
2
打赏
收藏
Hbase能做到随机读取部分数据么?
由于数据量太大, 我只需要部分数据作为样本进行一个简单的统计, 能不能随机查询一部分数据呢? 比如随机查询1/10的数据, 或者随机取1W条数据
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
whos2002110
2014-07-02
打赏
举报
回复
引用 1 楼 herofour444 的回复:
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
嗯, 我看到有个RandomRowFilter, 这个基本可以满足我的需求了
herofour444
2014-07-02
打赏
举报
回复
hbase提供随机读,随机写。 但是没有条件的读真不知道,不能自己构造些条件吗
hbase
高性能
读取
数据
有时需要从
Hbase
中一次
读取
大量的
数据
,同时对实时性有较高的要求。可以从两方面进行考虑: 1、
hbase
提供的get方法提供了批量获取
数据
方法,通过组装一个list gets即可实现; 2、Java多线程的Future方法实现了如何...
HBase
的
随机
读写
最近在学习大
数据
相关的知识,学到了
HBase
,对其中的
随机
实时读写不是很明白,从网上翻了翻文章,有两篇不错的,粘贴过来分享给大家。 第二篇文章在这: ...
Hbase
为什么支持
随机
读写
Hbase
为什么支持
随机
读写 基于HDFS,HDFS只支持追加写,不支持
随机
写!
随机
读写: 本质上还是追加写,基于版本号,实现
随机
写 append + 版本控制 update + delete :
随机
写 insert : 追加写 默认只返回时间戳...
HBase
海量业务
数据
二级查询实现毫秒级响应,
HBase
原理与
数据
模型设计详解
为什么需要使用
HBase
做海量业务
数据
的存储 ...3、高性能,由于底层的LSM
数据
结构和RowKey有序排序,
HBase
具备较好的
随机
读取
性能,RowKey的查询可达毫秒级响应 4、稀疏性、面向列存储,空列不...
为什么
Hbase
能实现快速的查询
A:如果快速查询(从磁盘读
数据
),
hbase
是根据rowkey查询的,只要能快速的定位rowkey, 就能实现快速的查询,主要是以下因素: 1、
hbase
是可划分成多个region,你可以简单的理解为关系型
数据
库的多个分区。 2、键是...
Hadoop生态社区
20,846
社区成员
4,695
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章