请教大家一个问题
想用cuda计算互相关函数,为什么下面这段代码算的总有错误
__global__ void dev_xcorr(float2 *a,float2 *b,float2 *c)
{
int tid=threadIdx.x+blockIdx.x*blockDim.x;
if(tid<NX)
{
for(int n=0;n<NX-tid-1;n++)
{
if((tid+n)>NX)
continue;
else
c[tid].x+=(a[n+tid].x*b[n].x+a[n+tid].y*b[n].y);
c[tid].y+=(b[n].x*a[n+tid].y-a[n+tid].x*b[n].y);
}
// tid+=blockDim.x*gridDim.x;
}
}
初学者,谢谢大家!