[Flink] Flink运行报错Container released on a lost node 有后续了吗
你好,对于spark sql读取hbase中数据,然后进行join的博文,思路是:读出来的数据hbaseRDD通过transform转成dataframe,然后register 成table,利用sql语句join 。我这边测试发现比直接利用rdd写个sort merge join算法,然后直接rdd join慢。可以探讨一下为什么吗?是因为register成table开销大吗?
576
社区成员
254,429
社区内容
加载中
试试用AI创作助手写篇文章吧