关于HBase表结构中RowKey的设计问题

有袁人 2016-11-16 05:25:49
在关系模型中,需要多个字段才能确定一个元组
比如:学校ID、年级ID、学科ID、某某ID,确定了一行数据。这四个字段加起来有200个字节

这样的模型,转化为HBase数据库表时,怎么设计其RowKey(网上建议不超过100个字节,甚至16个字节)
如果这四个字段不放在rowkey里,查询定位会不会很慢?
...全文
525 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
鲁邦 2016-11-27
  • 打赏
  • 举报
回复
二楼已经说得很好了。
shining_yyds 2016-11-22
  • 打赏
  • 举报
回复
rowkey要求不重复,某某ID应该不会重复吧。这个作为rowkey或者学校id+某某id作为rowkey。 剩下两个作为qualifier。 如果根据学科id或年级检索的多的话,采用二级索引也是不错的方案。 总之把最常用的字段作为rowkey就行了,没必要四个加一起吧。
LinkSe7en 2016-11-17
  • 打赏
  • 举报
回复
第一,可以字符串拼装然后Hash作为主键 第二,可以用phoenix做二级索引,那主键可以随意

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧