Intel Vtune

wuye1986 2011-04-02 05:50:21
有没有使用Intel Vtune Amplifier XE 2011的达人,能否一起讨论几个问题?
1、如何测试各级缓存的延迟,如L2 miss的延迟
2、要测试分支预测错误、L1指令缺失、L2指令/数据缺失等事件,应该要选用哪些events,这个让人头疼啊
3、Branch Misprediction和L1I Miss的代价如何获取
...全文
211 7 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
intel_iclifort 2011-04-19
  • 打赏
  • 举报
回复
如果是特别具体的软件工具问题,可以直接去“英特尔软件工具论坛”提问,那里的回复更加快些。
wuye1986 2011-04-18
  • 打赏
  • 举报
回复
谢谢peter,这个问题基本有进展了,主要是没有熟悉相关文档,不过又有新问题了,请您指教。
intel_zhenyuwang 2011-04-06
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 wuye1986 的回复:]
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出计算的时间。
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!
[/Quote]

VTune不直接给出Latency时间,只是测事件发生的次数。具体估算,我给出以下专家的文章链接供参考:
http://software.intel.com/sites/products/collateral/hpc/vtune/performance_analysis_guide.pdf
intel_zhenyuwang 2011-04-03
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 wuye1986 的回复:]
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取……
[/Quote]

尽我的能力把问题捋清楚吧。
1. 总的运行时间为:计算的时间加所有Stall的时间,减去“融合”的时间。此处总的时间并未考虑多核“并行”省下的时间。
2. Resource Stall All含所有的因素,如缓存不命中,分支误测等。各种因素说造成的Latency可通过Event来衡量,但到底多花了多少Clocks,可参阅处理器手册,VTune(TM)amplifer XE 并不直接给出。
3. 工具给出的是最后实际化的时间。开发者需根据代码实际情况,用Event来验证可能缺陷,修改代码后再测。
wuye1986 2011-04-03
  • 打赏
  • 举报
回复
补充一下, 我想计算存储延迟(L1、L2、LLC、TLB等)、分支预测错误等在程序运行时所占用的比重,获取上述几个参数对程序的影响
wuye1986 2011-04-03
  • 打赏
  • 举报
回复
假设我有这样一个应用场景,运行某个程序,我想获取它的运行总时钟数的组成,可以表示如下:
total_clock=computation time+memory stall + branch misp + resource stall
不知道理解对不对,或者说有更好的运行时钟组成计算。
针对上面各个部分,如何通过vtune amplifier 来计算程序运行时间的组成部分。
vtune里获取的是每个事件的采样结果,如果要计算该事件所占用的时钟数,是不是还应该乘以相应的事件代价(latency)。另外,我使用的是Intel i3处理器。
期待牛人解答。
peter为啥还没出现呢。
wuye1986 2011-04-03
  • 打赏
  • 举报
回复
感谢peter,各种因素造成的Latency,应该可以通过某些软件测试出来,不知Intel是否有这方面的软件。或者Intel处理器手册中已经给出了大概的数值,在实际中误差不会太大。
不知Vtune可否直接测试出计算的时间
已经看过您写的一些Vtune使用性能计数器的文章,解答了不少疑问。非常感谢!

567

社区成员

发帖
与我相关
我的任务
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
  • 英特尔技术社区
  • shere_lin
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧