社区
Hadoop生态社区
帖子详情
hbase那种表设计方式比较好
狂热的土豆
2015-08-04 09:07:20
hbase做查询,需要按照多个维度进行查询,因为hbase只有rowkey索引,不走rowkey都是全表扫描,为了保证查询速度,是将这些维度拼接作为rowkey还是分多个列族比较好?
...全文
332
4
打赏
收藏
hbase那种表设计方式比较好
hbase做查询,需要按照多个维度进行查询,因为hbase只有rowkey索引,不走rowkey都是全表扫描,为了保证查询速度,是将这些维度拼接作为rowkey还是分多个列族比较好?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sunandmoxi
2015-09-09
打赏
举报
回复
建立二级索引是最好的办法,可以采用协处理器或者Solr都可以
andyan_2008
2015-08-08
打赏
举报
回复
多列族对于查询没有帮助,可以建立二级索引,或者像楼上说的部分索引保存在其他数据库
atjl
2015-08-06
打赏
举报
回复
建议先按维度分类,时间类的可以用timestamp,主键类的放rowkey,其他条件查询在有rowkey的情况下可以查询出来再过滤,没rowkey条件的在关系数据库里存条件到rowkey的映射,查出rowkey再查hbase
夜无边CN
2015-08-05
打赏
举报
回复
首先多个列簇肯定是不好的。 如果你的“多个维度”如果拼接作为rowkey可以解决问题,可以拼接。 还有可以用solr就更灵活了,但也要多维护一个组件。
java连接
hbase
jar包
java连接
hbase
需要的jar包!欢迎下载!
HBase
的
表
结构
设计
文章目录
HBase
的
表
结构
设计
1 名称空间1.1 说明1.2 语法2 列蔟
设计
3 版本
设计
4 数据压缩4.1 压缩算法4.2 查看
表
数据压缩
方式
4.3 设置数据压缩5 ROWKEY
设计
原则5.1
HBase
官方的
设计
原则1. 避免使用递增行键/时序数据2. 避免ROWKEY和列的长度过大3. 使用long等类型比String类型更省空间4. ROWKEY唯一性5.2 避免数据热点1、 预分区2、 ROWKEY避免热点
设计
HBase
的
表
结构
设计
1 名
Hbase
中
表
结构的
设计
Hbase
表
设计
分布式存储学习——
HBase
表
结构
设计
本节将介绍如何
设计
HBase
的模式(Schema),将对比
HBase
与RDBMS的模式
设计
的异同,重点介绍模式
设计
中的两个要点——Rowkey和Column Family,并结合4个实例介绍如何进行
HBase
的模式
设计
。数据库的模式
设计
并不是一个新概念,在关系型数据库之前,模式
设计
的范式已经存在。其实,只要是可以称为“数据库”的系统,都存在模式
设计
的问题。作为一种典型的列式存储数据库,
HBase
的模式
设计
同样非常重要。
一文详解
HBase
表
设计
原则和实现
前言
HBase
作为一款历史悠久且具有代
表
性的NOSQL的数据库,其优点与缺点同样的明显,所以在确认了使用场景适合后下一步就是如何用好
HBase
了,不夸张的说,
HBase
使用的好与坏可能会造成天差地别,所以当你抱怨
HBase
如何的差劲不如XXX的时候,一定要先确认下自己是不是真的很好的使用了
HBase
,让其充分发挥出自己的亮点 正文 想要用好
HBase
,首先要确认自己的业务场景是不是适合使用
HBase
,这个我在另外一篇博文中已经有所描述
HBase
的使用场景,大家可以参考...
Hadoop生态社区
20,846
社区成员
4,695
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章