社区
CUDA
帖子详情
thrust::reduce 函数的一个小问题
adagio_chen
2015-02-06 03:25:58
加精
reduce函数中间有个 init 参数,非常重要,它可以确定函数的模板,例如,如果给 init 参数传入 0,那么 reduce 会使用 int 型来初始化模板,即使最后一个参数为 thrust::plus<float>
因此,大家使用 reduce 函数计算一个浮点数组的和时,千万不要偷懒把 init 参数写成 0,而要用浮点表示。
...全文
1502
14
打赏
收藏
thrust::reduce 函数的一个小问题
reduce函数中间有个 init 参数,非常重要,它可以确定函数的模板,例如,如果给 init 参数传入 0,那么 reduce 会使用 int 型来初始化模板,即使最后一个参数为 thrust::plus 因此,大家使用 reduce 函数计算一个浮点数组的和时,千万不要偷懒把 init 参数写成 0,而要用浮点表示。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
14 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
qq_25153763
2015-02-12
打赏
举报
回复
努力学习中 呵呵呵啊
lssrzj
2015-02-09
打赏
举报
回复
努力学习中,感谢
cattpon
2015-02-08
打赏
举报
回复
涨姿势~谢谢楼主
czsp2014
2015-02-08
打赏
举报
回复
谢谢分享!!!!
hugh_z
2015-02-08
打赏
举报
回复
learning
yaya1261
2015-02-08
打赏
举报
回复
学习,真心不懂
laoer_2002
2015-02-08
打赏
举报
回复
谢谢楼主分享
cattpon
2015-02-07
打赏
举报
回复
好像好复杂~看看~
nettman
2015-02-07
打赏
举报
回复
学习下
hugh_z
2015-02-07
打赏
举报
回复
learning
sinat_25885703
2015-02-07
打赏
举报
回复
好好好~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
YCMyTot
2015-02-06
打赏
举报
回复
多谢版主分享,还没用过函数库去解决一些问题,可能是学的太浅薄了。
Th
rust
快速入门教程(三)——算法 2
Reductions
Reduction算法使用二元操作将输入序列规约为
一个
单值。例如,需要获得一数列的和,可以通过加运算规约此数组得到。相似的,数列的最大值,可以通过由两个输入值返回
一个
最大值的运算子规约得到。数列的求和的规约操作可以由
th
rust
::
reduce
如下实现:
int sum =
th
rust
::
reduce
(D. begin () , D. end () , ( int ) 0,
th
rust
:: plus
());
CUDA中
th
rust
库的使用
CUDA中
th
rust
库的使用 接触过CUDA的各位应该都了解过归约算法,包括归约算法求和、求最大最小值、求方差标准差等等。为了保证算法的时间复杂度,我们常常会花费大量的时间去优化归约算法的实现,包括线程分散度的
问题
、
th
read分歧以及bank冲突的
问题
等等。当数据维度较小时还能够冷静的分析每
一个
可能还存在优化空间的点,但当数据维度较大时,常常感觉优化的程度还是不够。不要慌,这时就是体现CUDA强大的时刻,CUDA的
th
rust
库可以完美的解决这些
问题
。 本文主要记录一下最近使用到的
th
r
Th
rust
快速入门教程(四) —— Fancy Iterators
高级迭代器可以实现多种有价值功能。本节将展示如何利用高级迭代器和标准
Th
rust
算法处理
一个
更广泛的类
问题
。对于那些熟悉的Boost C ++库的开发者,他们会发现
Th
rust
的高级迭代器与Boost迭代器库非常相似。constant_iterator 常量迭代器最明显的特点,是每次解引用时,都会返回
一个
相同的值。下面的例子我们将
一个
常量迭代器的初始值设置为10。#include <
th
rust
/
Th
rust
库理解
(https://docs.nvidia.com/cuda/
th
rust
/index.html) 简介
Th
rust
是
一个
类似于STL的针对CUDA的C++模板库。T
rust
提供与CUDA C完全兼容的接口,可以使我们高效地编写高性能并行程序。
Th
rust
提供了丰富的数据并行算法,例如scan、sort、
reduce
等,可以简单快捷地构成复杂算法,并使得代码获得更高的可读性。...
c++17 transform_
reduce
的使用
/ c++17起// c++17起// c++17起// c++17起// c++17起// c++17起// c++17起// c++17起// c++17起// c++17起// c++17起。
CUDA
579
社区成员
2,918
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章