社区
Hadoop生态社区
帖子详情
关于HBase表结构中RowKey的设计问题
有袁人
2016-11-16 05:25:49
在关系模型中,需要多个字段才能确定一个元组
比如:学校ID、年级ID、学科ID、某某ID,确定了一行数据。这四个字段加起来有200个字节
这样的模型,转化为HBase数据库表时,怎么设计其RowKey(网上建议不超过100个字节,甚至16个字节)
如果这四个字段不放在rowkey里,查询定位会不会很慢?
...全文
525
3
打赏
收藏
关于HBase表结构中RowKey的设计问题
在关系模型中,需要多个字段才能确定一个元组 比如:学校ID、年级ID、学科ID、某某ID,确定了一行数据。这四个字段加起来有200个字节 这样的模型,转化为HBase数据库表时,怎么设计其RowKey(网上建议不超过100个字节,甚至16个字节) 如果这四个字段不放在rowkey里,查询定位会不会很慢?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
鲁邦
2016-11-27
打赏
举报
回复
二楼已经说得很好了。
shining_yyds
2016-11-22
打赏
举报
回复
rowkey要求不重复,某某ID应该不会重复吧。这个作为rowkey或者学校id+某某id作为rowkey。 剩下两个作为qualifier。 如果根据学科id或年级检索的多的话,采用二级索引也是不错的方案。 总之把最常用的字段作为rowkey就行了,没必要四个加一起吧。
LinkSe7en
2016-11-17
打赏
举报
回复
第一,可以字符串拼装然后Hash作为主键 第二,可以用phoenix做二级索引,那主键可以随意
HBase
数据库
设计
.doc
1.
HBase
有哪些基本的特征? 1
HBase
特征: 1 2.
HBase
相对于关系数据库能解决的
问题
是什么? 2
HBase
与关系数据的区别? 2
HBase
与RDBMS的区别? 2 3.
HBase
的数据模式是怎么样的?即有哪些元素?如何存储?等 3 1). 数据模式 3 2).
HBase
的基本元素: 4 3) 数据模型有哪些操作? 4 4) 返回结果的排序方式是什么? 5 5)最后,
HBase
不支持联合查询 5 mapreduce与
HBase
表
配合使用 5 4.
HBase
的模式Schema
设计
的一些概念和原则 5 1)模式的创建与更新 5 2)列族的数量 6 3)行键
设计
Row
Key
6 5.
HBase
的拓扑
结构
是什么? 7 1)拓扑
结构
7 2)
HBase
与ZooKeeper的关系是什么? 7 3)
HBase
的内部
结构
管理状况: 7 4)
HBase
的使用示例: 8 6.
HBase
与Cassender的比较 8 7:几个关键概念: 9 行键(
Row
Key
) 9 列族(ColumnFamily) 9 时间戳(TimeStamp) 9 单元格(Cell) 9 区域(Reg
Hbase
系统架构及数据
结构
HBase
中
的
表
一般有这样的特点:1大:一个
表
可以有上亿行,上百万列2面向列:面向列(族)的存储和权限控制,列(族)独立检索。3稀疏:对于为空(null)的列,并不占用存储空间,因此,
表
可以
设计
的非常稀疏。下面一幅图是
Hbase
在HadoopEcosystem
中
的位置。
HBase
以
表
的形式存储数据。
表
有行和列组成。列划分为若干个列族(
row
family)
Row
Key
与nosql数据库们一样,
row
key
是用来检索记录的主键。访问
hbase
table
中
的行,只有三种方式:1通过单个
row
key
访问2通过
row
key
的range3全
表
扫描
Row
key
行键(
Row
key
)可以是任意字符串(最大长度是
论文研究-基于
HBase
的网络社区海量数据存储优化研究 .pdf
基于
HBase
的网络社区海量数据存储优化研究,吴旭,郭建,基于
HBase
自动根据
Row
key
排序
表
中
数据的特性,在组织网络社区海量数据的存储
结构
时添加了时间戳以便按照时间段对海量数据进行查询,H
HBase
的
Row
Key
详解、
Row
Key
设计
原则和
Row
Key
优化方法
HBase
的
Row
Key
详解、
Row
Key
设计
原则和
Row
Key
优化方法
HBase
系列--
Row
Key
的
设计
原则
1.
Row
Key
是什么? 与nosql数据库们一样,
Row
Key
是用来检索记录的主键。访问
HBASE
table
中
的行,只有三种方式: 通过单个
Row
Key
访问(get) 通过
Row
Key
的range(正则)(like) 全
表
扫描(scan)
Row
Key
行键 (
Row
Key
)可以是任意字符串(最大长度是64KB,实际应用
中
长度一般为 10-100bytes),在
HBASE
内部,
Row
Key
保存为字节数组。存储时,数据按照
Row
Key
的字典序(byte order)排序存储。
设计
Row
Key
时,要充分
Hadoop生态社区
20,808
社区成员
4,690
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章