mapPartitions 内调用外部程序的问题
我希望在rdd的mapPartition函数内进行如下数据处理:
1. 每个rdd的partition存入executor所在的worker节点本地文件,
2. 调用worker节点的命令行程序 mycmd.!! 该命令行程序以1中生成的文件为输入,输出写到指定的文件
这个我调用的是 scala.sys.process._ 内
“ my command program”.!!
在scala下,这步是没有问题的
3. 读取解析2中的输出文件到rdd返回给driver
以上问题出在第二步,exitCode=50
请教有遇到同样问题的朋友吗?