多次调用kernel结果出错
大家好,我是新人,现在想问个问题。我的显卡是GT650,线程最多1024*4。 远远不够用,于是我就在kernel代码里让每个线程循环1万次,也就是处理1万个数据。 问题1: 为什么2万次以及以上得出来的结果不对?是不是里面寄存器啊什么的溢出了什么的?
于是我又想了个馊点子:问题2:主机调用kernel,然后接着再写一条调用kernel。出来的结果就不对?(是明显的不对,不是逻辑问题问题的不对)
现在我能想到的就是把运行正常的代码封装成一个函数,另外再重新写个main,再在里面重复调用封装好的函数。这样结果是对的,可是这样每调用一次又得重新读入数据,分配内存,数据传输,太浪费时间了啊...