社区
CUDA高性能计算讨论
帖子详情
求教CUDA中SP和线程的关系
aleyuan
2012-12-03 11:11:33
新入手CUDA,有些不明白,请大家指教
我看书上是这么写的
“一个block会被分配到同一个SM上”
“一个SP会处理一个线程”(当然应该不是指独占的)
以我的GTX560Ti为例
有8个SM384个核心,算一下应该是一个SM有43个SP
对于一个wrap是32个线程来说,43这个数字是不是有点尴尬??
一个warp同时执行是不是要占用32个SP?那剩下11个SP高不成低不就的怎么办?
是不是理解错了。。。
...全文
385
3
打赏
收藏
求教CUDA中SP和线程的关系
新入手CUDA,有些不明白,请大家指教 我看书上是这么写的 “一个block会被分配到同一个SM上” “一个SP会处理一个线程”(当然应该不是指独占的) 以我的GTX560Ti为例 有8个SM384个核心,算一下应该是一个SM有43个SP 对于一个wrap是32个线程来说,43这个数字是不是有点尴尬?? 一个warp同时执行是不是要占用32个SP?那剩下11个SP高不成低不就的怎么办? 是不是理解错了。。。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
aleyuan
2012-12-04
打赏
举报
回复
引用 1 楼 linxxx3 的回复:
除法算错了吧,一个SM是48个SP,调度是基于半个warp,即16线程,所以同时执行的是48线程,3个half-warp
额。。。丢死人了,那再问下,一个SM最多可以有8个block,那是这些block的wrap会以half-warp为单位抢占SP么?
linxxx3
2012-12-04
打赏
举报
回复
除法算错了吧,一个SM是48个SP,调度是基于半个warp,即16线程,所以同时执行的是48线程,3个half-warp
linxxx3
2012-12-04
打赏
举报
回复
后面一句的回答是yes,不过这种细节对编程几乎没有影响,而且也与前半句“一个SM最多可以有8个block”没有什么关系,这个纯粹是显卡计算能力的限制。所以乱猜是不好的,认真读官方文档吧
数据处理救星降世Power Query
0/ Excel数据处理新利器来了,准备好了吗?1/ 比网红函数VLOOKUP还全面的功能。——查(查询)2/ 取其精华,去其糟粕。——筛(筛选)3/ 拆分就像同学会,拆散一对是一对。——拆(拆分)4/ 天下大势,合久必分,分久必合。——合(合并)5/ 隔空取物,犹如探囊取物——提(提取)6/ 百转千回后的峰回路转。——转(转换)7/ 它判断真假的唯一标准。——判(判断)8/ 人以群分,物以类聚。——聚(聚合)9/ 我自己的难题自己造函数,不
求教
别人。——技法(自定义函数)
服务器虚拟环境装tensorflow和
cuda
但用不了gpu
收到华为小奖状,秋招结束,刷了半年多的牛客,离开前把自己的时间线写个流水账给需要的同学参考~##实习1、4月投递实习简历,5天后简历筛选收到知识产权承诺书,签署。上午开完组会,下午签完三方,我的秋招算是结束了,最终选择了个很卷的offer,但是只要自己喜欢,不留遗憾就好。两轮技术面+一轮hr面,最后给了个20K*14,年终还不定,可多可少。本来打算在一线浪两年再回家,结果老家国企相当于给开了个
sp
,手里有几个心怡的offer,不知道怎么选,大佬们帮忙投投票,最好给点建议引流大法,质疑理解成为#小鹏。
题解 | #零食类商品
中
复购率top3高的商品#
阿里系面试 阿里淘天 挂基本数据类型 然后一堆判断,以及为什么?比较的时候是如何转换?var let const,const声明的对象可以修改属性吗?如何使一个对象不能被Offer选择 能动鼠鼠累了,想上岸真诚
求教
{nowcoder-vote}{87818}腾讯面试 腾讯安全一面 挂数组的indexOf方法实现HardMan实现css选择器优先级di
sp
lay:none和visibility:hidden的区别v-if和v-十月
【虹软科技25届实习】--算法&;开发&;产品&;测试岗可转正
前面讲解过该同学阿里云的一面讲解和二面讲解,这是第三面的,继续给大家做讲解分析,参考回答和学习资料指引,联合起来,参考意义很大,期望大家有所收获~这篇文章主要考。华为上海研究所,无线网络产品线,技术预研部门,od招聘,前期hc充足,内推进行
中
,全程答疑指导,一起加油加油!最近看招24届的也不多,就参加了欧莱雅BRANDSTORM大赛,整体感觉还挺有意思的,和一个营销女生一起的,她带着我基本是躺赢,需要我干啥我就干啥,我主要提供技。好公司太难得了,为什么这一期选了苏州,因为北上广有哪些知名的公司,大家还。
农行深圳支行综合培养生和交行苏州分行市区营运方向怎么样
对于一些具有重复性的 HTTP 请求,比如每次请求得到的数据都一样的,可以把这对「请求-响应」的数。意向收到了半个月,但是网签一直下不来,比我晚拿到意向的同学都三方,问hr就是在积极推进,审批的时间会有点长,大家拿到网签时间不一样的原因是申请批次不一样,孩子现。岗位:前端工程师,base上海笔试时间:11.02,给了2天时间,笔试100分钟笔试题目:1、单选题,27题,一题3分,总共81分,几乎都是 JS 和 CSS。现在两个想去的第一个是新华三,地点薪资不确定,但是我想去南京杭州,只是三面都完成了。
CUDA高性能计算讨论
353
社区成员
615
社区内容
发帖
与我相关
我的任务
CUDA高性能计算讨论
CUDA高性能计算讨论
复制链接
扫一扫
分享
社区描述
CUDA高性能计算讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章