1,214
社区成员
发帖
与我相关
我的任务
分享
这篇文章最初发表在 NVIDIA 技术博客上。有关此类的更多内容,请参阅最新的 内容创建/渲染 新闻和教程。
Intrinsics 可被视为特定硬件指令的更高级别的抽象。它们提供对低级操作或特定于硬件的功能的直接访问,从而提高性能。这样,就可以在线程束中的线程间执行操作,也称为线程束中的线程波前.
以下代码示例是 SM6 的示例:
float(4) NvShflXor (float(4) input, uint LaneMask) { float(4) output = WaveReadLaneAt(input, WaveGetLaneIndex() ^ LaneMask); return output; }