NVIDIA GPU和HPC啥关系?有张不错的图

baidu_28255787 2015-05-22 01:10:17
现在搞HPC的也基本都用NVIDIA的GPU,然后搞CUDA编程。最近ASC挺火的,号称是世界最大的大学生超算竞赛,HPC的盛宴啊。看到有张图不错,对GPU跟HPC跟ASC的关系挺普及的,转来分享下:

...全文
890 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
1 页 Edit by Joson https://www.baidu.com/p/happy_Joson Stree_GPU 压力测试 一、测试介绍 常搞服务器测试的,会有很多测试工具,比如测试硬盘的 iometer,网络测 试的有 IxChariot,IPfer,测试内存的有 stree,整机压力测试 HPC_Breakin 等,但 整机测试 GPU 或是显卡的工具就比较少,专业的测试是必须要有的。 很多个人或是公司买了 GPU 服务器,显卡回来,安装上去后,不知道如 何整机测试,怎么压力测试,怎么检测是否有问题,做开发设计的怎么测试主板 是否有 bug,整机散热调优方案,功耗测试等,通过使使用 stree_GPU 工具,可 以使 GPU/显卡发挥 90%以上的性能,从而发现存在的隐患。 直接介绍一套简单的测试工具 Stree_GPU, 适合在 windows 7,win8,win10,2008 R2 等 windows 系统下测试的。 2 页 Edit by Joson https://www.baidu.com/p/happy_Joson 1、 准备工作环境 你的机器安装上显卡/GPU 卡后,然后再安装上述的操作系统,机器需要连外 网才能使用 Stree_GPU 测试。但它不占用外网资源。 2、安装驱动 这个不用我说了,你电脑上驱动都要安装,GPU/显卡一般是基于 NVIDIA 芯 片开发的,驱动一般直接到它官网上下载,或是安装个驱动人生,然后让它帮你 全部安装完驱动,省事^_^ 二、 测试工具使用介绍 1、Stree_GPU 工具使用介绍,此 stree_GPU 软件适用 windows 系统下 GPU/显卡专业测试工具 stree_GPU 测试工具下载: https://pan.baidu.com/s/1PnxbcIQvM9Y4YtVude7WNg 2、首先你的机器在 windows 下环境配置好,即显卡驱动要安装上,可以在 NVIDIA 官网下载 cuda 程序安装,能识别到你的显卡并能调休; 3、确保你测试的机器连通外网,因为测试时要模拟卡的压力(算力) ; 4、把 Stree_GPU 程序解压后拷贝到如 c 盘根目录下,路径不要有中文; 5、解压后在 Stree_GPU 目录里,右键以管理员权限运行 stree_GPU.bat 注意观察,如果执行之后屏幕上没有提示错误提示,没有红色的提示,则表示 开始跑起来了,过一会才会有结果,比如会提示有 GPU0:xxxMh/s,这里只要有 数字出现就表示成功了,如果有多张卡,这里会列出来有 GPU0,GPU1…..。如下 3 页 Edit by Joson https://www.baidu.com/p/happy_Joson 所示 机器测试压力程序已经跑起来了,那么就可以在功耗仪上读取电压,电流,功耗 数值,如下所示。 同时可以通过 BMC 管理界面,或是第三方的一些软件,可以监控到机器的各个 部件温度曲线的变化。测试时间越长,如果曲线波动不大,说明机器散热良好。 4 页 Edit by Joson https://www.baidu.com/p/happy_Joson 注意事项: 因为压力测试,注意机器的散热。风扇调全速转。机器跑起来了,此时可以测试 整机的功耗,散热、主板的供电,整机供电等等,一般测试时长 24H,这样可以 检验整机及部件稳定性等。这是最简单但最有效果的测试 GPU/显卡方案。 另外需要注意的是,机器要保持连接外网,并且测试过程不要断开网络,否则测 试不能进行。
资料共144份,包括但不限于: 5G+电信: 5G 时代统一的边缘云网建设; 红帽开源软件助力电信行业 GPU 应用; 基于 5G 车路协同智慧公交解决方案; 中国电信 5G 边缘计算推动产业互联网发展; 中国移动九天人工智能平台 GPU 推理实践; 助力 5G 和边缘计算,深入了解 Cloud XR; DPU 加速 5G; GPU 加速 5G 基站的的 DICT 融合; GPU 加速开源 5G; GPU 加速中国电信 Spark 大数据处理; NVIDIA 加持的 5G 云部署; Rivermax- 带您轻松跨入超高清视频的 IP 时代; 高性能计算: 超算集群网络管理神器 — UFM Cyber-AI; 基于 CPU-GPU 异构平台的第一性原理密度泛函理论高性能计算; 基于 GPU 加速的矩阵离散元方法实现与应用; 脑研究之利器:基于 NVIDIA GPU 的全脑尺度直接可视化方法; 全新 NVIDIA A100 80GB GPU 加速超大规模 HPC 和 AI 应用; 新型超级计算中的高速互联技术; CUBE:高可扩展宇宙学 N 体问题模拟程序; GPU 加速 Paradigm 解决方案; HPC 应用性能分析和调优; RDMA 在分布式存储中的应用; 深度学习平台及应用: 用 NVIDIA Jarvis 来构建你的语音助理; 安全 AI 平台 GPU 实践和思考; 飞桨推理引擎性能优化; 高阶信息如何加速神经网络训练?; 机智深度学习训练平台及应用; 基于 GPU 的机器翻译推理性能优化; 基于 Tensor Core 的 CNN INT8 定点训练加速; 如何快速搭建全 GPU 加速的 AI 应用; 使用 Triton 优化深度学习推理的大规模部署; 腾讯“开悟”游戏 AI 平台在 TensorRT 上的最佳实践; 语音技术效率优化实践; 预训练时代的机器翻译; 智能钛机器学习平台计算优化实践; Apache MXNet 2.0:连接深度学习与传统机器学习; Eva 平台在深度学习训练和推理上的实践和优化经验; FastSpeech:高效语音合成的算法设计及优化; GPU 在向量搜索中的应用; Hammer:一体化的模型压缩和 NAS 引擎框架; Lightseq:GPU 高性能序列推理实践; MULTI-INSTANCE GPU(MIG)深度学习最佳用法示例; TurboTransformers:高效的 Transformer 线上推理系统; Whale:统一多种并行化策略的分布式深度学习框架; 推荐系统: 爱奇艺使用 GPU 加速 CTR 模型训练的实践; 多标签分类:汉明损失和子集精度真的相互冲突吗?; 高性能网络加速智能推荐系统; 将 HugeCTR Embedding 集成于 TensorFlow; 推荐系统推理性能优化在“双十一”中的应用; 性能提升 7 倍 + 的高性能 GPU 广告推荐加速系统的落地实现; GPU 加速的数据处理在推荐系统中的应用; Merlin : GPU 加速的推荐系统框架; Merlin HugeCTR :深入研究性能优化; Merlin NVTabular:基于 GPU 加速的推荐系统特征工程最佳实践; NVIDIA 助力构建安全和高效的推荐系统; PLE — 一种新的分层萃取多任务学习网络结构; Vearch 的 GPU 方案在海量向量检索系统上的应用创新; 智慧金融: 分布式人工智能与金融应用; GPU 数据库在不同行业中的应用; NVIDIA 网络打造超低时延证券解决方案; 智慧医疗和生命科学: 3D 医疗影像数据深度学习高效训练与推理架构; 基于眼表像的 COVID-19 快捷风险筛查; 人工智能与药物研发; 随机对照试验 RCT 验证的消化内镜人工智能; 新型冠状病毒的全分子结构; 医学影像 + 人工智能的特点、技术与趋势; 医学真实世界人工智能研究与实践; AI 技术在医疗健康领域的应用探索; GPU 赋能长读长基因测序; GPU 技术在放射治疗领域的科学研究; NVIDIA Clara Guardian 助力构建智慧医院; 自动驾驶: 乘用车自动驾驶产业生态与协作; 构建中国特色仿真环境; NVIDIA Drive Sim 帮助解决无人驾驶预期功能安全问题; NVIDIA DRIVEWORKS SDK 中强大的实时传感器数据采集和回放工具助力自动驾驶开发; 自主机器和边缘计算: 智能物流机器人 — 小蛮驴; 从云到边:边缘智能开启 AI 新时代 加速行业落地; 多尺度 Jetson AI 端到端解决方案; 基于 AI 的工业缺陷检测与分类创新实践; 基于 Jetson 的点云加速及在自主机器的应用; 基于 Jetson 设备构建可信边缘计算;
NVIDIA GTC CHINA 2019 大会PPT汇总,共92份。 包括但不限于一下内容。 一、人工智能与深度学习 超越黑匣子:为深度学习注入结构 持久性 CUDA GPU 编程及其应用 从框架到平台,AWS 的深度学习实践 大规模算力平台构建和多机多卡线性扩展 滴滴端到端语音 AI 技术实践——从算法到应用 飞桨大规模分布式训练与应用 分析深度学习网络模型及自动混合精度以优化性能 基于 GPU 的 AI 计算优化方法及案例:从训练到推理 基于 GPU 的大规模音频理解和合成解决方案 基于 GPU 的大规模语言模型加速 基于 OCR 案例的 TENSORFLOW-TENSORRT(TF-TRT) 最佳实践 基于 T4 的推荐系统推理性能优化 基于 TACOTRON2 和 WAVEGLOW 的端到端语音合成加速方案 基于 TENSORFLOW 的 TRANSFORMER 模型应用与优化 计算新纪元下金融 AICC 的全双工全场景 金融行业像识别及结构化内容抽取的 AI 应用实践 利用 TENSORRT 自由搭建高性能推理模型 美团面向生活服务场景的计算机视觉研发和应用 面向量化分析师的 GPU 加速 PYTHON 人工智能,从表型组到基因组 人工智能数据管道与应用 人工智能在医学像临床诊断中应用研究 深度学习的对抗安全理论与方法 深度学习在心脑血管分割中的应用 深度语义匹配模型在搜狗搜索中的实践 生活服务领域知识谱的构建及应用 使用自动混合精度加速 PADDLEPADDLE 训练 数字生命与数据自由—— GPU 加速健康大数据分析 通过 GPU 计算和深度学习加速基因分析 针对深度学习的汇编级优化-快速提高应用性能 二、智能机器、物联网和机器人 为自主机器打造的 JETSON AGX平台 ET 自动驾驶计算平台演进 三、专业视觉可视化 《光明记忆》RTX光线追踪制作经验 《剑侠情缘网络版叁》:使用实时光线追踪技术进行画质革新 超高分辨率在媒体和娱乐行业中的应用及其优化方法 光线追踪技术带来设计变革-使用QUADRO RTX GPU优化工业设计流程 基于 RTX 的云端实时渲染以及云端虚拟工作室 基于 UNITY 高清渲染管线的实时光线追踪技术介绍 基于视频信息指导的智能编舞系统 可视化技术带来产品和建筑设计的新纪元 利用 AI 技术改变视频的制作流程 利用 RTX 实现虚拟现实中的仿真渲染 人工智能运动场:提高人类的创造力 软硬件环境对建筑结构流程管理(BIM)效率的影响 商业化视频内容识别的算法设计与应用 实时光线追踪基础 使用 NVIDIA DATA SCIENCE WORKSTATION 加速数据科学实时案例分析 虚幻引擎实时光线追踪技术开启 CG 制作新时代 正在改变影视行业的 GPU 驱动的影像质量优化 四、自动驾驶汽车 大规模深度学习加速自动驾驶落地 深度学习平台在汽车智能战略中的应用 自动驾驶统一架构 五、HPC与超级计算 带有 OPENACC 和 CUDA 库的 VASP 中的新 GPU 功能 当 MARS 遇上 RAPIDS:使用 GPU 加速分布式海量数据处理的原理和实战 基于 GPU 加速的高性能数据科学计算环境 数据分析新速度:加速数据科学转变成商业洞察 卷积神经网络介绍及其在 3D 点云语义分割领域的应用 网络智能化分级及验证 运营商 5G 通信网络 AI 研发与实践 在阿里云容器服务中使用 GPU 加速数据科学 AR 边缘云白皮书技术概览 GPU 加速的 GIS 数据现实平台 GPU 加速数据科学的兴起 OPTICKS:基于 NVIDIA OPTIX 的 GPU 光子模拟 RAPIDS:GPU 加速平台的内与外

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧