社区
CUDA
帖子详情
cuda的kernel中创建大数组
PhD_C
2014-12-11 05:01:27
另外最近我碰到一个问题。我在cuda的kernel中创建了一N维数组,double的,只参与计算,不返回值。也就是每个线程都需要这么一个数组来暂存计算中间量。不知为何,当N不大的时候,会得出正确结果;而当N取很大的时候,大概100000向上,kernel貌似就不计算了。。不知有没有解决办法
...全文
537
1
打赏
收藏
cuda的kernel中创建大数组
另外最近我碰到一个问题。我在cuda的kernel中创建了一N维数组,double的,只参与计算,不返回值。也就是每个线程都需要这么一个数组来暂存计算中间量。不知为何,当N不大的时候,会得出正确结果;而当N取很大的时候,大概100000向上,kernel貌似就不计算了。。不知有没有解决办法
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
YCMyTot
2014-12-12
打赏
举报
回复
额。。。计算量是有多大? 没遇到过这种情况!!
CUDA
加速排序算法
而ttid变量则用来表示所有的块
中
的当前线程的唯一索引,或者说整个Grid
中
的当前线程的索引。而内核
中
使用的共享内存
中
数组
的元素数量等于块
中
的线程数,如同我们之前讨论过的那样。当最终的循环完成后,count变量
中
...
2021SC@SDUSC
cuda
实现模幂运算源码分析(1)
典型的
CUDA
方法是为每个问题实例分配一个线程,但是多精度算法需要大量寄存器资源,因此将多精度值分布到一组连续线程
中
会更有效。这是CGBN实现的基本逻辑。 从一个样本内核开始,该内核传递了一系列问题实例,...
CUDA
C编程学习笔记
尽管可以使用多核和众核来区分CPU和GPU的架构,但这两种核心是完全不同的。 CPU核心比较重,用来处理非常复杂的控制逻辑,以优化串行程序执行。...为使你拥有充分的控制权并使系统达到最佳性能,
CUDA
运行
CUDA
入门之利用GPU寻找一组数据
中
最大的k个元素(一)
利用“插入排序”实现
CUDA
优化寻找一组数据
中
最大的k个元素
CUDA
编程 基础与实践(樊哲勇) 摘录
cuda
中
的核函数必须被限定词__global__修饰。核函数返回类型必须是空类型。 一个典型、简单的
CUDA
程序的结构具有以下形势 intmain(void) { 主机代码 核函数调用 主机代码 return 0 } 主机在调用一个核...
CUDA
579
社区成员
2,918
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章