未来NVIDIA的猜想

_梦魇花葬 2014-08-01 10:56:06
加精
CUDA6.0的特性
1、统一寻址(Unified Memory):
可直接访问CPU内存、GPU显存,无需在彼此之间手动拷贝数据,可在大量编程语言中更简单地添加GPU加速支持。
其实CUDA 4就开始支持统一虚拟寻址,x86 CPU、GPU内存池可在同一空间内进行寻址,但那仅仅是简单的内存管理,摆脱不了手动数据转移。
CUDA 6则在现有的内存池结构上增加了一个统一内存系统,程序员可以直接访问任何内存/显存资源,或者在合法的内存空间内寻址,而不用管涉及到的到底是内存还是显存。
不过注意,CUDA 6并不是完全不需要数据拷贝,只不过将这个工作从程序员那里接过来自动执行而已,它仍然受制于PCI-E的带宽和延迟,因此和AMD hUMA异构统一寻址架构是不一样的。
2、插入式库(Drop-in Libraries):
简单地用GPU加速库替换已有的CPU库,BLAS(基础线性代数程序集)、FFTW(快速傅立叶变换)计算即自动提速最多8倍。
3、多GPU扩展(Multi-GPU Scaling):
重新设计的BLAS、FFT GPU库,单个节点可自动支持最多八颗GPU,双精度浮点性能可超过9TFlops,并且支持最多512GB的更大负载。
那我们大家来讨论一下,在不久的将来NVIDIA会怎么样去优化CUDA,从而使得CUDA更进一步呢?
请各位小伙伴畅所欲言呀!~~~~
...全文
768 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
xusir98 2014-08-06
  • 打赏
  • 举报
回复
beyondcj 2014-08-06
  • 打赏
  • 举报
回复
不可触碰 2014-08-04
  • 打赏
  • 举报
回复
额,能简单点就好,使用者不用去关心GRID,BLOCK,THREAD就好啦

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧