社区
英特尔边缘计算技术
帖子详情
Intel Vtune
wuye1986
2011-04-02 05:50:21
有没有使用Intel Vtune Amplifier XE 2011的达人,能否一起讨论几个问题?
1、如何测试各级缓存的延迟,如L2 miss的延迟
2、要测试分支预测错误、L1指令缺失、L2指令/数据缺失等事件,应该要选用哪些events,这个让人头疼啊
3、Branch Misprediction和L1I Miss的代价如何获取
...全文
228
7
打赏
收藏
Intel Vtune
有没有使用Intel Vtune Amplifier XE 2011的达人,能否一起讨论几个问题? 1、如何测试各级缓存的延迟,如L2 miss的延迟 2、要测试分支预测错误、L1指令缺失、L2指令/数据缺失等事件,应该要选用哪些events,这个让人头疼啊 3、Branch Misprediction和L1I Miss的代价如何获取
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
intel_iclifort
2011-04-19
打赏
举报
回复
如果是特别具体的软件工具问题,可以直接去“英特尔软件工具论坛”提问,那里的回复更加快些。
wuye1986
2011-04-18
打赏
举报
回复
谢谢peter,这个问题基本有进展了,主要是没有熟悉相关文档,不过又有新问题了,请您指教。
intel_zhenyuwang
2011-04-06
打赏
举报
回复
[Quote=引用 4 楼 wuye1986 的回复:]
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出计算的时间。
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!
[/Quote]
VTune不直接给出Latency时间,只是测事件发生的次数。具体估算,我给出以下专家的文章链接供参考:
http://software.intel.com/sites/products/collateral/hpc/vtune/performance_analysis_guide.pdf
intel_zhenyuwang
2011-04-03
打赏
举报
回复
[Quote=引用 1 楼 wuye1986 的回复:]
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取……
[/Quote]
尽我的能力把问题捋清楚吧。
1. 总的运行时间为:计算的时间加所有Stall的时间,减去“融合”的时间。此处总的时间并未考虑多核“并行”省下的时间。
2. Resource Stall All含所有的因素,如缓存不命中,分支误测等。各种因素说造成的Latency可通过Event来衡量,但到底多花了多少Clocks,可参阅处理器手册,VTune(TM)amplifer XE 并不直接给出。
3. 工具给出的是最后实际化的时间。开发者需根据代码实际情况,用Event来验证可能缺陷,修改代码后再测。
wuye1986
2011-04-03
打赏
举报
回复
补充一下, 我想计算存储延迟(L1、L2、LLC、TLB等)、分支预测错误等在程序运行时所占用的比重,获取上述几个参数对程序的影响
wuye1986
2011-04-03
打赏
举报
回复
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取的是每个事件的采样结果,如果要计算该事件所占用的时钟数,是不是还应该乘以相应的事件代价(latency)。另外,我使用的是Intel i3处理器。
期待牛人解答。
peter为啥还没出现呢。
wuye1986
2011-04-03
打赏
举报
回复
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出
计算的时间
。
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!
Intel
vtune
profiler 使用指导
Intel
vtune
profiler 使用指导
Intel
VTune
Amplifier基本使用说明
文章根据本人使用
Intel
VTune
Amplifier进行软件性能分析的实践写成的。简单明了,可以给刚接触这款软件的人对此软件的大概了解。
intel
vtune
性能分析工具使用说明
自己写的
vtune
使用总结,介绍基本使用方法,大家多提建议
采用
Intel
VTune
进行代码优化和性能提升
采用
Intel
VTune
进行代码优化和性能提升,提高程序质量!
intel
Vtune
intel
性能分析 工具 介绍 ppt
英特尔边缘计算技术
568
社区成员
7,024
社区内容
发帖
与我相关
我的任务
英特尔边缘计算技术
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
复制链接
扫一扫
分享
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章