hbase的region

西红小柿 2017-03-21 12:02:07
当一个region数据存储达到极限,分裂成两个region,那么上面的新增rowkey是如何继续添加的?
...全文
1043 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
西红小柿 2017-06-12
  • 打赏
  • 举报
回复
region分裂时,会找到rowkey的midkey作为分裂界点,然后新插入的数据会放入到startkey最大的那个region上,另外一个region既成为一个半满状态的region,为了避免这种情况,我们避免这种情况发生,根据实际情况来提前进行预分区。比如我一个region放入一百万条数据。我大概有2000万条数据,那么建立20个分区即可
小风0092 2017-03-22
  • 打赏
  • 举报
回复
region a: 100->200 分裂 region b1: 100->150 region b2: 151->200 插入key:160,放到region b2
LinkSe7en 2017-03-21
  • 打赏
  • 举报
回复
每个region负责各自的startKey~endKey。你新分配的rowKey属于哪个region的范围,就会被放在该region上

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧