AWS Redshift优化

开心的生鱼片 2018-08-12 05:34:43
我们公司的业务属于Redshift的重度使用者,有4个集群节点来支持10个数据库表。其中有一张大表命名为“click_track”用来记录用户在移动app上的点击操作。这个表会在每个月的第一天做一次删减,以只保留3个月内的数据。由于业务增长迅速,现在这张表会在月中的时候数据量暴涨,达到30亿数据量,并且磁盘空间达到95%的占用率。

基于以上情况,我的问题有两个:
1. 磁盘使用率非常不平均,在其中的两个节点上,使用率为92%,但在另外两个节点上,使用率是45%, 请问如何能够平衡这4个节点的磁盘使用率?

2. 我们每周都在为这张大表做Vacuum维护以释放磁盘空间,但是随着表的size增加,变得很慢。有时候需要12个小时来完成一个动作,并且影响再次期间的更多的写入性能,请问如何可以优化呢?
...全文
323 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复

7,391

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧