CUDA中一个SM如果包含了多个线程块

考完高考high起来 2020-12-22 03:58:29

那么这个SM是一个线程块一个线程块的进行处理呢，即对第一个线程块取一个线程束，处理完之后对这个线程块的第二个线程束处理。
还是每个线程块，各取几个线程，组合成一个线程束进行处理。
还是第一个线程块的第一个线程束处理完之后，从另一个线程块中选择一个线程束进行处理？

...全文

800 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

首先概括一下这几个概念。其中SM（Streaming Multiprocessor）和SP（streaming Processor）是硬件层次的，其中一个SM可以包含多个SP。thread是一个线程，多个thread组成一个线程块block，多个block又组成一个线程网格grid。现在就说一下一个kenerl函数是怎么执行的。一个kernel程式会有一个grid，grid底下又有数个block，每个block是一个thread群组。在同一个block中thread可以通过共享内存（shared mem

本文详细介绍了GPU的结构与并行的原理

sm流处理器簇对blocks的调度策略在cuda中，GPU中的SM（比如GTX650有两个SM处理器）被CPU调度器把线程块逐个分配到SM上，每个SM同时处理这个被分配的线程块，但是每次每个时刻只能处理一个warp的线程束。由于有时候存在读取等操作导致等待，那么SM会转而处理其他warp 来掩盖这个延迟。一个warp 的线程束不是在同一线程块中。为什么每次同时处理多个block，而且为什...

CUDA的线程模型

硬件描述从硬件上看，一块显卡的最小单元是GPU核(或者叫做Stream Processor),所有核心平均分配在多个SM中，而多个SM共同构成整块显卡的核心。比如RTX2070有36个Streaming Multiprocessors，而每个SM有64个CUDA Cores，RTX2070具有36*64=2304个CUDA Cores。软件描述 thread，block，grid，war...

CUDA高性能计算讨论

357

社区成员

615

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章