[quote=引用 5 楼 link0007 的回复:] 文件名集合->文件名rdd->mapToPair(jni调用你c函数)->文件名,特征集合PairRdd 重点是你c的函数能不能访问hdfs,否则你的音频数据文件要分发到每台worker节点上的同一路径下。 或者改造能接收文件内容(即字节数组)而不是文件路径。那么流程就变为: 文件名集合->文件名rdd->mapToPair->文件名,文件内容字节数组RDD->map(jni调用你c函数)->文件名,特征集合PairRdd
文件名集合->文件名rdd->mapToPair(jni调用你c函数)->文件名,特征集合PairRdd 重点是你c的函数能不能访问hdfs,否则你的音频数据文件要分发到每台worker节点上的同一路径下。 或者改造能接收文件内容(即字节数组)而不是文件路径。那么流程就变为: 文件名集合->文件名rdd->mapToPair->文件名,文件内容字节数组RDD->map(jni调用你c函数)->文件名,特征集合PairRdd
不知道你的外部C程序的输入、输出是什么? 我现在遇到的问题和你类似,我的方法是在rdd.mapPartitions内处理
1,269
社区成员
1,169
社区内容
加载中
试试用AI创作助手写篇文章吧