社区
英特尔边缘计算技术
帖子详情
请教:怎么才能测出程序运行时cache的命中率呢?
yutia3n
2007-01-17 08:30:17
请教诸位一个问题,用什么方法或者软件能够的到intel平台上程序运行时的cache命中率?
请大家不吝赐教。
...全文
1391
5
打赏
收藏
请教:怎么才能测出程序运行时cache的命中率呢?
请教诸位一个问题,用什么方法或者软件能够的到intel平台上程序运行时的cache命中率? 请大家不吝赐教。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
i_am_xiaoga
2007-02-06
打赏
举报
回复
cache miss一般有两种表示方法,miss rate和每千条指令的miss次数。以L1为例:
L1 cache miss rate
= 1st-Level cache load miss retired / loads retired
即L1 miss次数比上总的load次数。
每千条指令的L1 miss次数
= 1000 * 1st-Level cache load miss retired / Instructions retired 。
1st-Level cache load miss retired ,loads retired,Instructions retired 都可以做为event测出来。
Simbao
2007-01-31
打赏
举报
回复
那个程序是如何实现的?
没有这方面的汇编指令吧?
songbd
2007-01-29
打赏
举报
回复
在Linux环境中 可以用Oprofile工具。免费的哈。^_^
icansaymyabc
2007-01-19
打赏
举报
回复
Re:亲爱的icansaymyabc
非常感谢你给我的cache命中率测试问题的留言。今天才拿到intel vtune,第一次使用,希望你能把设置的步骤给我介绍详细一点。如蒙赐教,不胜感激。....
---------------------------------------
安装好的VTune菜单里有一个教程 Getting Started Tutorial
你必须把它看完看懂。
之后用 Analyzer projects 中的 Sampling Wizard 创建一个项目。
记住要勾选 Modify default configuration when done wizard。
然后在配置对话框的左边选中 Sampling,再点中间的 Configure 按钮,
又弹出一个配置框,它的 Event Ratios 和 Events 页里有非常多种类的计数器可供选择。
Event Ratios 返回的是比率。Events 返回原始计数值。
要看Cache,在Event Ratios 中选 Memory Event Ratios 类别的
1st level Cache Load Hit Rate
1st level Cache Load Miss Performance Impact
同时选中 General 类的
2nd-Level Cache Load Hit Rate
2nd-Level Cache Load Misses per Instructions Retired
在 Events 里选择 All events 类, 关于 Cache 的计数器都是排在前面的。
icansaymyabc
2007-01-18
打赏
举报
回复
手动配置 VTune 的 Sampling 项目的参数,可以选出 Cache 失败率的计数器来。
打造千万级流量秒杀第二十二课 本地缓存实战:如何使用内存缓存提升数据
命中率
?
ok { t.Fatal("failed") } } 在 Goland 中点击单元测试函数左边的绿色箭头,或者在项目根目录下执行命令 go test -v ./infrastructure/stores ,便可以运行单元测试。如果代码逻辑正确,你将看到 PASS TestInt
Cache
...
如何编写100%
cache
miss的C
程序
如何编写保证100%
cache
miss的
程序
?本文将作出讲述及详细代码分析。
实践:服务器编写/系统架构/
cache
在用户不是太多的时候,长连接还是很有用的,可以节约分组,提升响应速度,但是一旦超出某个平衡点,由于为了保持很多长连接,创建了太多的进程,导致系统不堪重负,内存不够了,开始换入换出,cpu也被很多进程吃光...
关于Oracle数据库分页查询的小技巧
而取总数时使用count(*),为提高
cache
的
命中率
,尽量做到SQL重用。另外,提高性能的好选择可能就是把所有的字符数据都保存为Unicode,Java以Unicode形式处理所有数据,因此,数据库驱动
程序
不必再执行转换过程。而这...
最全面软件测试面试宝典--------(满满干货,最适合测试小白的面试宝典)
当我运行脚本的时候我看聚合报告 90%的平均响应时间达到了 6s,吞吐量也比较小,用 top 命令监控资源发现 CPU 差不多到了 100%。上面把个场景设置好了之后,提交给我们,我们就是根据老大设置好的那些场景编写了基本...
英特尔边缘计算技术
568
社区成员
7,024
社区内容
发帖
与我相关
我的任务
英特尔边缘计算技术
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
复制链接
扫一扫
分享
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章