__shared__ memory 的奇怪问题
一个 kernel, 我开了1024个 block, 256 个thread, GPU = 9300GM
__global__ void foo()
{
extern __shared__ float shared[];
}
这样写就可以成功,如果按照下面的写法, 程序就不执行foo,进去后马上退出foo程序
__global__ void foo()
{
__shared__ float shared[2048];
}
而我实际使用的 shared memory 大小就是2048, 请问有没有人碰到过类似问题