社区
CUDA
帖子详情
关于GT430显卡的一个疑惑
saigirl
2013-02-05 10:17:38
GT430显卡用deviceQuery得出核心数是:
( 2) Multiprocessors x ( 48) CUDA Cores/MP: 96 CUDA Cores
warp size 是32.
如果我的理解没有错的话是说有2个SM,每个SM里有48个SP。但是一次指令执行一个warp,即由32个SP完成。但任意时刻只能执行一个warp,这样一个SM中空余的16个SP不是浪费了么?
是我理解有问题么?还是说这样设计有什么别的用处?
...全文
433
34
打赏
收藏
关于GT430显卡的一个疑惑
GT430显卡用deviceQuery得出核心数是: ( 2) Multiprocessors x ( 48) CUDA Cores/MP: 96 CUDA Cores warp size 是32. 如果我的理解没有错的话是说有2个SM,每个SM里有48个SP。但是一次指令执行一个warp,即由32个SP完成。但任意时刻只能执行一个warp,这样一个SM中空余的16个SP不是浪费了么? 是我理解有问题么?还是说这样设计有什么别的用处?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
34 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
qq_16654789
2014-06-18
打赏
举报
回复
emperro
2014-06-18
打赏
举报
回复
不太懂 来学习学习
balian2015
2014-06-18
打赏
举报
回复
这是一个多线程的问题
biscuij
2014-06-18
打赏
举报
回复
实际的实现,一次是以half warp,即16线程一组来执行,同一个warp的另外一半16线程紧接其后被调度。我理解的两个half warp的执行是不能拆开的,所以逻辑上,并行的最小单位是32线程,看你怎么理解。不了解这个细节,对编程也没有影响。
MLYLX
2014-06-18
打赏
举报
回复
我想说这个显卡你拿来干嘛了 ,不好说
sinat_16613645
2014-06-17
打赏
举报
回复
不是很懂的说
超人佳仔
2014-06-17
打赏
举报
回复
我想说这个显卡你拿来干嘛了
超人佳仔
2014-06-17
打赏
举报
回复
我想说这个显卡你拿来干嘛了
爱生活.
2014-06-17
打赏
举报
回复
我想说这个显卡你拿来干嘛了
qq_16613009
2014-06-17
打赏
举报
回复
下载flexled,求积分
sinat_16612855
2014-06-17
打赏
举报
回复
我想说这个显卡你拿来干嘛了
qq_16611689
2014-06-17
打赏
举报
回复
有2个SM,每个SM里有48个SP。但是一次指令执行一个warp,即由32个SP完成。但任意时刻只能执行一个warp,这样一个SM中空余的16个SP不是浪费了么
gunnimadande
2014-06-17
打赏
举报
回复
fermi的架构,只有执行双精度浮点运算的时候,才需要32个SP一起工作,这时候,同时执行的仍然是16线程。GT430没有双精度浮点运算能力
底层弱鸡程序员
2014-06-17
打赏
举报
回复
观望学习!!
ldq6605
2014-06-17
打赏
举报
回复
有2个SM,每个SM里有48个SP。但是一次指令执行一个warp,即由32个SP完成。但任意时刻只能执行一个warp,这样一个SM中空余的16个SP不是浪费了么
ldq6605
2014-06-17
打赏
举报
回复
参数你写的应该没问题,执行的时候,逻辑上按一个warp 32线程来并行,这是CUDA文档上的说法,便于理解。实际的实现,一次是以half warp,即16线程一组来执行,同一个warp的另外一半16线程紧接其后被调度。我理解的两个half warp的执行是不能拆开的,所以逻辑上,并行的最小单位是32线程,看你怎么理解。不了解这个细节,对编程也没有影响。 fermi的架构,只有执行双精度浮点运算的时候,才需要32个SP一起工作,这时候,同时执行的仍然是16线程。GT430没有双精度浮点运算能力,所以48个SP没有问题,不会浪费
ldq6605
2014-06-17
打赏
举报
回复
长见识,这个论坛有科学价值。
qq_16622245
2014-06-17
打赏
举报
回复
不是很懂的说
qq_16618227
2014-06-17
打赏
举报
回复
这个显卡 低端的 你到底想用来干嘛啊
qq_16617969
2014-06-17
打赏
举报
回复
430凑合啊
加载更多回复(8)
Java项目电商秒杀[Redis+RabbitMQ+JMeter]
我所有课程的学习主线为:java基础--->面向对象--->java高级部分(集合、多线程、正则表达式等)--->html5+css3--->javascript--->jquery--->mysql数据库--->jsp/servlet--->oracle数据库---&...
linux dsdt屏蔽
显卡
,黑苹果Nvidia免驱
显卡
黑屏的解决方法整理
文章前言相信大家一定会感到
疑惑
,免驱
显卡
怎么会黑屏?在实践中,对于就像gt240、gt520、gtx650、gtx660、gtx750等等的免驱N卡中的确有一部分免驱卡出现黑屏,原因很简单,接口问题。解决方法有三种:一、换接口。...
linux切换到独显,笔记本双
显卡
如何切换到独立
显卡
为帮助大家解答这一
疑惑
,下面百分网小编带大家一起来看看详细操作方法,希望对大家有所帮助!想了解更多相关信息请持续关注我们应届毕业生考试网!右键点击我的电脑 > 属性 > 设备管理器 &...
pr用什么
显卡
比较好_Adobe Premiere视频渲染用的
显卡
该怎么选?
相信这个
疑惑
肯定伴随着很多视频剪辑师,毕竟大家浸淫在性能至上的大环境里面,一定都在说:要想快?买张顶级
显卡
吧!那么实际上是否真的需要那么高性能的
显卡
吗?我们将会以专业级视频剪辑软件Adobe Premiere CC ...
CPU和
显卡
的合理搭配(转东转西)
怎么样才能尽量用最少的投资升级来获得高性价比的系统,这是
一个
DIYer们长久以来不断争论的话题。如今,CPU、
显卡
的进化速度越来越快。我们的老 AMD XP、老 P4 如何升级?升级 CPU 还是
显卡
?新攒机用什么主流...
CUDA
581
社区成员
2,919
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章