社区
Hadoop生态社区
帖子详情
hbase那种表设计方式比较好
狂热的土豆
2015-08-04 09:07:20
hbase做查询,需要按照多个维度进行查询,因为hbase只有rowkey索引,不走rowkey都是全表扫描,为了保证查询速度,是将这些维度拼接作为rowkey还是分多个列族比较好?
...全文
339
4
打赏
收藏
hbase那种表设计方式比较好
hbase做查询,需要按照多个维度进行查询,因为hbase只有rowkey索引,不走rowkey都是全表扫描,为了保证查询速度,是将这些维度拼接作为rowkey还是分多个列族比较好?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sunandmoxi
2015-09-09
打赏
举报
回复
建立二级索引是最好的办法,可以采用协处理器或者Solr都可以
andyan_2008
2015-08-08
打赏
举报
回复
多列族对于查询没有帮助,可以建立二级索引,或者像楼上说的部分索引保存在其他数据库
atjl
2015-08-06
打赏
举报
回复
建议先按维度分类,时间类的可以用timestamp,主键类的放rowkey,其他条件查询在有rowkey的情况下可以查询出来再过滤,没rowkey条件的在关系数据库里存条件到rowkey的映射,查出rowkey再查hbase
夜无边CN
2015-08-05
打赏
举报
回复
首先多个列簇肯定是不好的。 如果你的“多个维度”如果拼接作为rowkey可以解决问题,可以拼接。 还有可以用solr就更灵活了,但也要多维护一个组件。
java连接
hbase
jar包
java连接
hbase
需要的jar包!欢迎下载!
HBase
的
表
结构
设计
文章目录
HBase
的
表
结构
设计
1 名称空间1.1 说明1.2 语法2 列蔟
设计
3 版本
设计
4 数据压缩4.1 压缩算法4.2 查看
表
数据压缩
方式
4.3 设置数据压缩5 ROWKEY
设计
原则5.1
HBase
官方的
设计
原则1. 避免使用递增行键/时序数据2. 避免ROWKEY和列的长度过大3. 使用long等类型比String类型更省空间4. ROWKEY唯一性5.2 避免数据热点1、 预分区2、 ROWKEY避免热点
设计
HBase
的
表
结构
设计
1 名
Hbase
中
表
结构的
设计
Hbase
表
设计
分布式存储学习——
HBase
表
结构
设计
本节将介绍如何
设计
HBase
的模式(Schema),将对比
HBase
与RDBMS的模式
设计
的异同,重点介绍模式
设计
中的两个要点——Rowkey和Column Family,并结合4个实例介绍如何进行
HBase
的模式
设计
。数据库的模式
设计
并不是一个新概念,在关系型数据库之前,模式
设计
的范式已经存在。其实,只要是可以称为“数据库”的系统,都存在模式
设计
的问题。作为一种典型的列式存储数据库,
HBase
的模式
设计
同样非常重要。
Hadoop生态社区
20,846
社区成员
4,695
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章