社区
CUDA
帖子详情
将C程序翻译成CUDA能用的程序
ak200111
2011-11-22 08:34:44
有没有比较简单的方法让一个C程序在CUDA上能跑,比如SHA1
由于新学,对CUDA还不了解,在不管效率的情况下,哪怕只是单线程,有没有办法用较小的改动就能让一个完整的C程序在CUDA上运行
...全文
121
4
打赏
收藏
将C程序翻译成CUDA能用的程序
有没有比较简单的方法让一个C程序在CUDA上能跑,比如SHA1 由于新学,对CUDA还不了解,在不管效率的情况下,哪怕只是单线程,有没有办法用较小的改动就能让一个完整的C程序在CUDA上运行
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ak200111
2011-12-07
打赏
举报
回复
请教大牛后(他们说的比较高深),我得到一些模糊的答案,大概说是在写好的C程序前后做个封装,处理下变量存放,就可以放在线程中跑了,但每个线程有一定限制,一般数据量不要太大。
hnuzhoulin
2011-11-27
打赏
举报
回复
[Quote=引用 2 楼 ak200111 的回复:]
就是不太会啊呵呵,感觉被打击了。
不知将变量全申明为设备上的变量,程序能跑吗?
希望有高手指点..
[/Quote]
其实如果你懂C,能用C写SHA1的话,花一点点心思看看CUDA,很容易搞定的。。
只是做了一个C的扩展,然后稍微了解一下GPU的结构,就OK。
我觉得关键是需要有编程基础,,,,,,,上面说的就是不管效率的情况下 的
alpha.5
2011-11-23
打赏
举报
回复
呵呵 好像暂时还不行, 要不你写一个吧..
ak200111
2011-11-23
打赏
举报
回复
就是不太会啊呵呵,感觉被打击了。
不知将变量全申明为设备上的变量,程序能跑吗?
希望有高手指点..
FFmpeg系列之35:FFmpeg+
CUDA
硬件加速原理与案例
FFmpeg+
CUDA
硬件加速原理与案例实战FFmpeg系列之35FFmpeg第2季编解码专题之5:FFmpeg+
CUDA
硬件加速原理与案例实战本课程主要讲解的知识点包括:GPU高性能编程
CUDA
入门、
CUDA
编程模型的原理解析、
CUDA
编程小白案例入门实战、
CUDA
官方经典案例实战与解析、FFmpeg+CUVID硬件加速原理与命令行、Qt+FFmpeg实现
cuda
硬解码加速代码实战等。---------------------------------------------------------------目前FFmpeg第二季【编解码专题】,主要包括以下课程:FFmpeg4.3系列之31:图像格式与压缩FFmpeg4.3系列之32:MPEG-1/2视频编解码FFmpeg4.3系列之33:H.264/H.265视频编码FFmpeg4.3系列之34:FFmpeg+DXVA2+D3D硬件加速FFmpeg4.3系列之35:FFmpeg+
CUDA
硬件加速
CUDA
C 编程指南
《
CUDA
C Programming Guide》(《
CUDA
C 编程指南》)导读田子宸浙大水硕在读184 人赞同了该文章说明转自知乎《
CUDA
C Programming Guide》(《
CUDA
C 编程指南》)导读 - 田子宸的文章 - 知乎 https://zhuanlan.zhihu.com/p/53773183最近在学习
CUDA
,感觉看完就忘,于是这里写一个导读,整理一下重点主要内...
CUDA
10.0官方文档的翻译与学习之介绍
背景 从这次开始,我将用数篇博客来分享前一阵我对
CUDA
10.0官方文档之编程指南的翻译与学习的笔记。由于内容非常多,我将每一章单独分享出来,可能有地方翻译得词不达意,所以建议大家参考原文:https://docs.nvidia.com/
cuda
/archive/10.0/
cuda
-c-programming-guide/index.html 介绍 从图像处理到通用目的的平行计算 在不知满足的追求实时性的市场的驱动下,高分辨度的3D图像、可编程的gpu已经进化成了一个高度并行化、多线程多核处理器、拥
CUDA
编程之快速入门
CUDA
(Compute Unified Device Architecture)的中文全称为计算统一设备架构。做图像视觉领域的同学多多少少都会接触到
CUDA
,毕竟要做性能速度优化,
CUDA
是个很重要的工具,
CUDA
是做视觉的同学难以绕过的一个坑,必须踩一踩才踏实。
CUDA
编程真的是入门容易精通难,具有计算机体系结构和C语言编程知识储备的同学上手
CUDA
编程应该难度不会很大。本文章将通过以下五个方...
CUDA
10.0官方文档的翻译与学习之编程接口
目录 背景 用nvcc编译 编译工作流 二进制适配性 ptx适配性 应用适配性 C/C++适配性 64位适配性
cuda
c运行时 初始化 设备内存 共享内存 页锁主机内存 可移植内存 写合并内存 映射内存 异步并发执行 主机与设备间的并发执行 并发核执行 数据迁移与核执行重叠 并发数据传输 流 多设备系统 设备枚举: 设备选择 流与事件行为 对等结点内存访问 对等结点内存复制 统一虚地址空间 进程间通信 错误检查 调用栈 纹理内存和表面(s.
CUDA
579
社区成员
2,918
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章