社区
CUDA
帖子详情
请问CUDA中有没有最大值表示,如果有的话怎么表示?谢谢
wts_net
2009-05-26 11:08:25
如题
...全文
91
5
打赏
收藏
请问CUDA中有没有最大值表示,如果有的话怎么表示?谢谢
如题
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
无心人_过过小日子
2009-05-27
打赏
举报
回复
[Quote=引用 4 楼 wts_net 的回复:]
比如说我定义了
struct aa{
int ss;
int yy
};
我又定义了kernel函数
__global__chuandi(struct cc)
{
........
}
是这样吗传递参数吗?不是的话应该怎么修正呢?
[/Quote]
typedef struct __aa__ {
int ss;
int yy;
} AA;
__global__chuandi(AA cc)
{
........
}
wts_net
2009-05-27
打赏
举报
回复
比如说我定义了
struct aa{
int ss;
int yy
};
我又定义了kernel函数
__global__chuandi(struct cc)
{
........
}
是这样吗传递参数吗?不是的话应该怎么修正呢?
无心人_过过小日子
2009-05-26
打赏
举报
回复
[Quote=引用 1 楼 wts_net 的回复:]
在CUDA的kernel函数要是以结构体作参数 是不是在kernel函数前要定义结构体?如果不是的话,怎么办才好呢?
[/Quote]
在kernel之前定义结构体类型:
typedef struct xxx {
......
} XXX;
参数传送的话用值传送.
无心人_过过小日子
2009-05-26
打赏
举报
回复
[Quote=引用楼主 wts_net 的帖子:]
如题
[/Quote]
什么的最大值?
如是int,short,char,float,double之类的,和C的定义一样.
wts_net
2009-05-26
打赏
举报
回复
在CUDA的kernel函数要是以结构体作参数 是不是在kernel函数前要定义结构体?如果不是的话,怎么办才好呢?
CUDA
使用共享内存查找数组
中
的
最大值
cuda
共享内存寻找数组
最大值
CUDA
入门之利用GPU寻找一组数据
中
最大的k个元素(一)
利用“插入排序”实现
CUDA
优化寻找一组数据
中
最大的k个元素
cuda
-Block和Grid设定
CUDA
的Threading:Block和Grid设定 硬件基本架构 实际上在 nVidia 的 GPU 里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个 SP 会在附加一些其他单元,一起组成一个 SM(Streaming Multiprocessor)。几个 SM 则会在组成所谓
CUDA
从入门到精通
CUDA
从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA
编程,随后将该技术应用到了实际项目
中
,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个
CUDA
专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习
CUDA
的童
cuda
从入门到精通(五)
CUDA
实现AI模型
中
的softmax
NVIDIA提供了许多
CUDA
库,如cuBLAS和cuDNN,这些库为许多常见的线性代数运算提供了高效的实现。例如,在上述示例
中
,我们在GPU上分配了额外的内存来存储输入和输出的副本。为了避免这种情况,我们可以从每个输入值
中
减去
最大值
,这样可以确保所有的输入值都在可接受的范围内。:了解你正在使用的硬件的特性,并根据这些特性进行优化。例如,不同的GPU可能有不同的内存带宽和计算能力,这可能会影响你的代码的性能。这些只是优化
CUDA
代码的一些基本建议,具体的优化策略可能会根据你的应用和硬件的特性而有所不同。
CUDA
589
社区成员
2,924
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章