社区
英特尔边缘计算技术
帖子详情
Intel Vtune
wuye1986
2011-04-02 05:50:21
有没有使用Intel Vtune Amplifier XE 2011的达人,能否一起讨论几个问题?
1、如何测试各级缓存的延迟,如L2 miss的延迟
2、要测试分支预测错误、L1指令缺失、L2指令/数据缺失等事件,应该要选用哪些events,这个让人头疼啊
3、Branch Misprediction和L1I Miss的代价如何获取
...全文
211
7
打赏
收藏
Intel Vtune
有没有使用Intel Vtune Amplifier XE 2011的达人,能否一起讨论几个问题? 1、如何测试各级缓存的延迟,如L2 miss的延迟 2、要测试分支预测错误、L1指令缺失、L2指令/数据缺失等事件,应该要选用哪些events,这个让人头疼啊 3、Branch Misprediction和L1I Miss的代价如何获取
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
intel_iclifort
2011-04-19
打赏
举报
回复
如果是特别具体的软件工具问题,可以直接去“英特尔软件工具论坛”提问,那里的回复更加快些。
wuye1986
2011-04-18
打赏
举报
回复
谢谢peter,这个问题基本有进展了,主要是没有熟悉相关文档,不过又有新问题了,请您指教。
intel_zhenyuwang
2011-04-06
打赏
举报
回复
[Quote=引用 4 楼 wuye1986 的回复:]
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出计算的时间。
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!
[/Quote]
VTune不直接给出Latency时间,只是测事件发生的次数。具体估算,我给出以下专家的文章链接供参考:
http://software.intel.com/sites/products/collateral/hpc/vtune/performance_analysis_guide.pdf
intel_zhenyuwang
2011-04-03
打赏
举报
回复
[Quote=引用 1 楼 wuye1986 的回复:]
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取……
[/Quote]
尽我的能力把问题捋清楚吧。
1. 总的运行时间为:计算的时间加所有Stall的时间,减去“融合”的时间。此处总的时间并未考虑多核“并行”省下的时间。
2. Resource Stall All含所有的因素,如缓存不命中,分支误测等。各种因素说造成的Latency可通过Event来衡量,但到底多花了多少Clocks,可参阅处理器手册,VTune(TM)amplifer XE 并不直接给出。
3. 工具给出的是最后实际化的时间。开发者需根据代码实际情况,用Event来验证可能缺陷,修改代码后再测。
wuye1986
2011-04-03
打赏
举报
回复
补充一下, 我想计算存储延迟(L1、L2、LLC、TLB等)、分支预测错误等在程序运行时所占用的比重,获取上述几个参数对程序的影响
wuye1986
2011-04-03
打赏
举报
回复
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取的是每个事件的采样结果,如果要计算该事件所占用的时钟数,是不是还应该乘以相应的事件代价(latency)。另外,我使用的是Intel i3处理器。
期待牛人解答。
peter为啥还没出现呢。
wuye1986
2011-04-03
打赏
举报
回复
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出
计算的时间
。
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!
Intel
vtune
profiler 使用指导
Intel
VTune
Profiler 使用指导
Intel
VTune
Profiler 是一种功能强大的性能优化和调试工具,由
Intel
公司开发,旨在帮助开发者优化和调试基于
Intel
架构的应用程序。以下是
Intel
VTune
Profiler 的使用指导,...
Intel
VTune
Amplifier基本使用说明
###
Intel
VTune
Amplifier基本使用说明 #### 一、
VTune
Amplifier XE 能力概述
Intel
VTune
Amplifier XE 是一款强大的性能分析工具,它能够帮助开发者深入理解应用软件的性能瓶颈所在,从而指导优化方向。下面...
intel
vtune
性能分析工具使用说明
###
Intel
VTune
性能分析工具使用说明 #### 一、引言
Intel
VTune
是一款由英特尔公司开发的强大性能分析工具,广泛应用于软件优化和性能调试领域。它能够帮助开发者深入理解应用程序的行为,识别性能瓶颈,从而指导...
采用
Intel
VTune
进行代码优化和性能提升
Intel
VTune
Amplifier,简称
VTune
,是一款强大的性能分析工具,专为开发者设计,用于检测和解决CPU、GPU以及内存等方面的性能瓶颈。本文将深入探讨如何利用
Intel
VTune
进行代码优化和性能提升。 首先,了解
Intel
...
intel
Vtune
**
Intel
Vtune
:强大的性能分析工具**
Intel
Vtune
是一款由
Intel
公司开发的高性能计算和数据中心应用的性能分析工具。它专为优化软件性能而设计,通过深入洞察应用程序的运行情况,帮助开发者识别并解决性能瓶颈,...
英特尔边缘计算技术
567
社区成员
7,024
社区内容
发帖
与我相关
我的任务
英特尔边缘计算技术
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
复制链接
扫一扫
分享
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章