社区
云存储
帖子详情
hbase预分区
静谭水月
2019-11-20 04:14:52
为什么region预分区以后再切分是按照默认10g的条件切,为什么不按照r^2*block.max切 min(r^2*block.max,默认的10g)
...全文
214
回复
打赏
收藏
hbase预分区
为什么region预分区以后再切分是按照默认10g的条件切,为什么不按照r^2*block.max切 min(r^2*block.max,默认的10g)
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
HBase
的
预
分区
HBase
默认建表时有一个region,这个region的rowkey是没有边界的,即没有start key和end key,在数据写入时,所有数据都会写入这个默认的region,随着数据量的不断增加,region的size越来越大时,大到一定的阀值,
hbase
认为再往这个region里塞数据已经不合适了,就会找到一个midKey将region一分为二,成为2个region,这个过程称为分裂(region-split).而midKey则为这二个region的临界,左为N无下界,右为M无上界。 midKey则会被塞到M区。 在此过程中,会产生两个问题:【1】热点写,总是会往最大的start-
基于
预
分区
策略的装备数据分布式存储方法.pdf
#资源达人分享计划#
hbase
的Rowkey设计方案.pdf
hbase
的Rowkey设计⽅案 1.1
hbase
的概述 的概述
HBase
由于其存储和读写的⾼性能,在OLAP即时分析中越来越发挥重要的作⽤。作为Nosql数据库的⼀员,
HBase
查询只能通过其 Rowkey来查询(Rowkey⽤来表⽰唯⼀⼀⾏记录),Rowkey设计的优劣直接影响读写性能。 由于
HBase
是通过Rowkey查询的,⼀般Rowkey上都会存⼀些⽐较关键的检索信息,我们需要提前想好数据具体需要如何查询,根据查询 ⽅式进⾏数据存储格式的设计,要避免做全表扫描,因为效率特别低。 此外易观⽅⾈也使⽤
HBase
做⽤户画像的标签存储⽅案,存储每个app的⽤户的⼈⼝学属性和商业属性等标签信息。
HBase
中设计有MemStore和BlockCache,分别对应列族/Store级别的写⼊缓存,和RegionServer级别的读取缓存。如果RowKey过 长,缓存中存储数据的密度就会降低,影响数据落地或查询效率。 1.2
hbase
的设计原则以及解决⽅法 的设计原则以及解决⽅法 1.3
预
分区
预
分区
1.3.1 什么是
预
分区
什么是
预
分区
HBase
表在刚刚被创建时,只有1个
分区
(
云存储
932
社区成员
652
社区内容
发帖
与我相关
我的任务
云存储
云计算 云存储相关讨论
复制链接
扫一扫
分享
社区描述
云计算 云存储相关讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章