hbase那种表设计方式比较好

狂热的土豆 2015-08-04 09:07:20
hbase做查询,需要按照多个维度进行查询,因为hbase只有rowkey索引,不走rowkey都是全表扫描,为了保证查询速度,是将这些维度拼接作为rowkey还是分多个列族比较好?
...全文
320 4 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
sunandmoxi 2015-09-09
  • 打赏
  • 举报
回复
建立二级索引是最好的办法,可以采用协处理器或者Solr都可以
andyan_2008 2015-08-08
  • 打赏
  • 举报
回复
多列族对于查询没有帮助,可以建立二级索引,或者像楼上说的部分索引保存在其他数据库
atjl 2015-08-06
  • 打赏
  • 举报
回复
建议先按维度分类,时间类的可以用timestamp,主键类的放rowkey,其他条件查询在有rowkey的情况下可以查询出来再过滤,没rowkey条件的在关系数据库里存条件到rowkey的映射,查出rowkey再查hbase
夜无边CN 2015-08-05
  • 打赏
  • 举报
回复
首先多个列簇肯定是不好的。 如果你的“多个维度”如果拼接作为rowkey可以解决问题,可以拼接。 还有可以用solr就更灵活了,但也要多维护一个组件。

20,848

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧