KYLIN cube优化相关的

wppwpp1 2018-08-14 05:00:25
最近在研究 KYlin 优化的问题,想问个问题,

Kylin中建Cube时使用了Mandatory Dimensions,Joint Dimensions时,比如有维度A、B、C、D,E 我建的维度是 Mandatory Dimensions 为 A,B,
Joint Dimensions 为C,D,E,我查询的sql是
1, select C, count(C) from tableinfo where A=1 AND B= 2 group by c
2, select D, count(D) from tableinfo where A=1 AND B= 2 group by D
2, select E, count(E) from tableinfo where A=1 AND B= 2 group by E

这样能命中相应cuboid吗?或者有更好的推荐吗?(A,B一般都是写在where条件里,不放在group by后面)
...全文
256 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
ha757204887 2018-08-30
  • 打赏
  • 举报
回复
必要维度:
用户有时会对某一个或几个维度特别感兴趣,所有的查询请求中都存在group by这个维度,那么这个维度就被称为必要维度,只有包含此维度的Cuboid会被生成(如图10)。假设维度A是必要维度,那么生成的Cube则如图所示,维度数目从16变为9。



联合维度

用户有时并不关心维度之间各种细节的组合方式,例如用户的查询语句中仅仅会出现group by A, B, C,而不会出现group by A, B或者group by C等等这些细化的维度组合。这一类问题就是联合维度所解决的问题。例如将维度A、B和C定义为联合维度,Kylin就仅仅会构建Cuboid ABC,而Cuboid AB、BC、A等等Cuboid都不会被生成。最终的Cube结果如图5所示,Cuboid数目从16减少到4。


所以少年,修改你的定义把

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧