基于CUDA的GPU编程用于大量图像处理的思路
刚开始研究CUDA编程,打算用于大量遥感图像的几何校正。
入门教程里的示例是从整个算法模块中抽取一段适于并行的部分放入GPU中计算(如for循环部分)
想请教前辈,这里实际应用时的编程思路是什么?
比如有1000幅待计算的图像,GPU有1000个核心。
是逐个图像计算,把几何校正算法模块中的某些部分放到这1000个核心上并行运算;
还是1000幅图像同时计算,每幅图像的几何校正算法模块放到1个核心上运算?
介绍说GPU的逻辑运算能力不如CPU,什么程度的逻辑运算可以放到GPU上,什么程度的不适用?