关于线程分段处理的问题

yuanwcj 2013-11-14 12:11:00
新手,刚接触cuda,有很多问题不解,望大侠指教
有100M个数据, 我想在kernel中用100个block, 每个block 有1k个线程, 每个线程做1k个点的fft处理,然后问题出来了...
1.请问我这样处理的方式有没有问题,感觉和指南里面的操作方式差异很大...
2.关于block和thread的大小设置,我程序中thread最大512的时候,kernel就不运行了..
3.我需要在kernel函数中开辟一定大小的内存用于存放数组或指针,kernel函数运算完成后,显卡对这些内存是怎么管理的
4.如果开辟内存的话,每个block中的开辟的总内存数会相当高,会对执行效率有多大的影响...

恳请各位大侠指教
...全文
191 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

580

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧