大数据Doris(六十七):Doris on ES在快手商业化的架构实现
进而导致每个KIS task包含了所有取值的数据(我们生成环境KIS task数目与topic的partion数是一一对应的),造成KIS task的segment文件大幅膨胀(两种区别的理论值为key By处理生成的segment大小为不做key by的 1/partion总数),影响实时数据的查询性能(这里如果没太看明白可以参考阅读Druid官方文档,了解Druid数据聚合、索引构建原理)。ES拥有强大的分词检索能力,支持较高频率的update操作,和很好的横向扩展能力。屏蔽复杂的跨引擎管理查询逻辑。