社区
CUDA高性能计算讨论
帖子详情
GPU和CPU排序算法比较
电力信息系统
2009-05-12 08:44:44
加精
如题,目前GPU上实现了那些常用的排序算法呢?效率如何啊?
...全文
2426
31
打赏
收藏
GPU和CPU排序算法比较
如题,目前GPU上实现了那些常用的排序算法呢?效率如何啊?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
31 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
yan1130081679
2011-05-11
打赏
举报
回复
正在学习双调网络
yan1130081679
2011-05-11
打赏
举报
回复
正在学习双调网络
horizon37
2009-12-23
打赏
举报
回复
CUDA 中的SDK中有一个双调排序 你可以看一下
eli3716
2009-11-17
打赏
举报
回复
进来学习的。准备自己实现一个。
linlinyuyu
2009-11-04
打赏
举报
回复
xuexi
qzcwx
2009-10-18
打赏
举报
回复
顶!
zwang4000
2009-10-13
打赏
举报
回复
你去看看CUDA SDK的Sample,里面有
Maschinenwissen
2009-09-03
打赏
举报
回复
你们怎么就只说不练呢? 排序算法我觉得对GPU本身不是非常合适,因为涉及到要不停的交换数据,如果不进行特别优化,比CPU也快不了多少。
无心人_过过小日子
2009-09-03
打赏
举报
回复
[Quote=引用 22 楼 senosy 的回复:]
你们怎么就只说不练呢? 排序算法我觉得对GPU本身不是非常合适,因为涉及到要不停的交换数据,如果不进行特别优化,比CPU也快不了多少。
[/Quote]
下面官网的首页中就有排序算法和加速度比,好好找来看看吧:
http://www.nvidia.com/object/cuda_home.html#
我是大当家
2009-08-29
打赏
举报
回复
回帖是一种美德!每天回帖即可获得 10 分可用分!
yjwx19
2009-08-26
打赏
举报
回复
ATI什么时候有这个就好了
无心人_过过小日子
2009-08-25
打赏
举报
回复
[Quote=引用 18 楼 ilyyyfn 的回复:]
quick sort:gpu实现的效率怎么样?
[/Quote]
有个实现,效果不错.
ilyyyfn
2009-08-25
打赏
举报
回复
quick sort:gpu实现的效率怎么样?
无·法
2009-08-23
打赏
举报
回复
不懂哇,帮顶一下
cammy168
2009-05-14
打赏
举报
回复
路过...................
Freelook
2009-05-14
打赏
举报
回复
等待中……
yygis
2009-05-14
打赏
举报
回复
看看
fldx
2009-05-13
打赏
举报
回复
回帖是一种美德!每天回帖即可获得 10 分可用分!
exk900
2009-05-13
打赏
举报
回复
有待学习
jurenwangzi8
2009-05-13
打赏
举报
回复
谢谢分享!
加载更多回复(7)
sequential-vs-parallel-sort:C ++中实现的顺序
排序算法
与CUDA中实现的并行
排序算法
之间的
比较
研究,这是硕士学位论文的一部分
信息 作为硕士论文的一部分,对C ++中实现的顺序
排序算法
与CUDA中实现的并行
排序算法
之间的
比较
进行了研究。 我们实现了七个算法:双音排序,多步双音排序,自适应双音排序,合并排序,快速排序,基数排序和样本排序。 顺序算法是在使用C ++的
CPU
上实现的,而并行算法是在使用CUDA平台的
GPU
上实现的。 我们改进了上述实现,并采用了它们,以便能够对任意长度的输入序列进行排序。 我们在六个不同的输入分布上
比较
了算法,这些分布包括32位数字,32位键值对,64位数字和64位键值对。 结果表明,基数排序是最快的顺序
排序算法
,而基数排序和合并排序是最快的并行
排序算法
(取决于输入分布)。 与顺序实现相比,通过并行实现,我们最多可实现157倍的加速。 作者:DarkoBožidar 导师:TomažDobravec博士 资料下载 结果: : 硕士学位论文(斯洛文尼亚版) : : usp
不规则模型的质量3D点云的并行快速
排序算法
针对没有显式拓扑关系的质点云,提出了一种并行快速
排序算法
。 引入了莫顿阶并将其用于合并一维数据。 生成不规则模型的质量点云,对应的地址代码称为Morton码,这些点存储在八叉树结构链中。 然后使用基于欧几里得距离的并行快速
排序算法
对
CPU
和
GPU
进行排序。 点的k个最近邻居可以位于链中。 实验结果表明,该算法可以节省大量时间,并且可以直接搜索k点的最近邻。 该算法比在整个点云上使用的那些复杂排序方法更简单。
yolov3_deepsort:使用YOLOv3,深度排序和Tensorflow实现的对象跟踪
使用YOLOv3,深度排序和Tensorflow进行对象跟踪 该存储库实现了YOLOv3和Deep SORT,以便进行实时对象跟踪。 Yolov3是一种使用深度卷积神经网络执行对象检测的算法。我们可以将这些对象检测结果馈入Deep SORT(具有Deep Association Metric的简单在线和实时跟踪),以便创建实时对象跟踪器。 入门 conda(推荐) # Tensorflow
CPU
conda env create -f conda-
cpu
.yml conda activate tracker-
cpu
# Tensorflow
GPU
conda env create -f conda-
gpu
.yml conda activate tracker-
gpu
点子 # TensorFlow
CPU
pip install -r requirements.txt # Tenso
GPU
加速整数向量
排序算法
本文介绍了一种基于CUDA平台实现的
GPU
加速整数向量
排序算法
,但是该算法仍然存在许多可以优化的空间,比如通过对数据进行合理的预处理、选用更优秀的并行
排序算法
等方式进一步提高排序的性能。
GPU
加速整数向量
排序算法
的核心思想是将排序任务划分为多个独立的子任务,然后利用
GPU
的并行计算能力对每个子任务进行排序,并最终合并结果。数据划分:将要排序的整数向量划分成若干个大小相同的子向量,并将每个子向量分配到
GPU
的不同计算单元中。并行排序:在
GPU
的每个计算单元中,使用快速排序等经典的
排序算法
对子向量进行排序。
GPU
版基数排序(radix sort)
基数
排序算法
的思想很简单,但如何提高并行性,使得能用
GPU
进行高效的排序计算呢?本文介绍适合于
GPU
计算版本的
排序算法
。
CUDA高性能计算讨论
353
社区成员
615
社区内容
发帖
与我相关
我的任务
CUDA高性能计算讨论
CUDA高性能计算讨论
复制链接
扫一扫
分享
社区描述
CUDA高性能计算讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章