最近项目开发需要用到并行计算,于是看了opencl,但是验证并行的效果,跟预想的不一样。不知道是我用错了还是什么,求大神解惑。代码如下
分三个函数,按任务并行模型
平台初始化,数据拷贝等等
设置参数,执行函数。计算时间
numPlatforms:1
numDevices:1
gpu:16-34:26 113
gpu:16-34:26 298
最终gpu执行函数的时间。
下面是cpu进行同样数据的运算
cpu:16-36:26 256
cpu:16-36:26 340
最终cpu计算的时间
为什么cpu还会快一些呢。急求解惑。谢谢