让人费解的效率问题

tjac00260 2011-08-11 12:07:24
在现实服务器上的效率优化问题
下面为伪代码

//这里的数据不影响外部逻辑运转
//外部会对m_pcData数据做引用,但不做任何处理,对程序过程没有任何影响
//这里总计会运行50000次
//编译器为vs2008,优化:最大速度优化
//返回0则会这段程序运行无效
int CXX::GetValue(CXXINFO **pInfo)
{
//pInfo的数据从内存池中取出,内存池大小为1GB
//pInfo取出的数据为内存池中的零散数据,非线性或者连续的
if (0 == GetInfo(pInfo))
return false;

//return 0;这里返回,则总程序运行时间为x(case1)
//CXX为new出来的全局对象
//m_pcData为char *类型的类成员变量
m_pcData = (*pInfo)->m_pcData;//这里仅为指针赋值
//return 0;这里返回,则总程序运行时间为x+5毫秒(case2)

return 0;
}

测试机cpu为i5-2400
case3:
以case2为蓝本,把外部对m_pcData的引用去掉,时间则会变为x
对于这点可以理解为编译器对程序结构的优化,将m_pcData = (*pInfo)->m_pcData;这句优化
case4:
以case2为蓝本,不去除外部对m_pcData的引用,时间则增长为x+5.

按理说,中间的两次寻址加一次赋值,一共执行50000次,效率也不应该这么慢的
实在让人费解,还望有高人能不吝赐教
...全文
116 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
luciferisnotsatan 2011-08-11
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 tjac00260 的回复:]

这个问题是比较的蛋痛

这里并没有涉及到拷贝构造的问题,或者默认执行构造函数,大家想复杂了

还有x的测试数据是10-12毫秒,所以这个5毫秒是相当有杀伤力的

具体原因,我有个猜测了,主要在pInfo的问题上,由于程序下文中没有引用到pInfo的数据,所以在GetInfo这个函数中所有涉及到pInfo的操作全部被vs2008编译器优化(就是删除掉了)。同样,当我用一个全局变量去引用……
[/Quote]
如果if (0 == GetInfo(pInfo)) 这句优化掉了,那这函数不就没什么内容了。也要10-12毫秒??
加上GetInfo(pInfo)才多5毫秒。感觉要不GetInfo没有优化调,要不你的时间获取有问题。可以反汇编看下有没有优化掉。同时可以看下,到底多了哪些指令,导致慢了那么多时间。

Jinhao 2011-08-11
  • 打赏
  • 举报
回复
1,
如果
m_pcData = (*pInfo)->m_pcData;//这里仅为指针赋值
是热点。
那么热点无处不在了。。。

2,
*pInfo引用的数据不在CPU的cache line中。LZ说了是服务器,那很可能是多核多CPU的环境,这个问题更为突出。LZ尝试分析CXXXINFO的数据结构看看设计得是否合理。

3,
不知道了
tjac00260 2011-08-11
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 tjac00260 的回复:]

这个问题是比较的蛋痛

这里并没有涉及到拷贝构造的问题,或者默认执行构造函数,大家想复杂了

还有x的测试数据是10-12毫秒,所以这个5毫秒是相当有杀伤力的

具体原因,我有个猜测了,主要在pInfo的问题上,由于程序下文中没有引用到pInfo的数据,所以在GetInfo这个函数中所有涉及到pInfo的操作全部被vs2008编译器优化(就是删除掉了)。同样,当我用一个全局变量去引用……
[/Quote]
写错了,在GetInfo函数中编译器无法对pInfo的操作进行优化,则保留原有数据操作。
tjac00260 2011-08-11
  • 打赏
  • 举报
回复
这个问题是比较的蛋痛

这里并没有涉及到拷贝构造的问题,或者默认执行构造函数,大家想复杂了

还有x的测试数据是10-12毫秒,所以这个5毫秒是相当有杀伤力的

具体原因,我有个猜测了,主要在pInfo的问题上,由于程序下文中没有引用到pInfo的数据,所以在GetInfo这个函数中所有涉及到pInfo的操作全部被vs2008编译器优化(就是删除掉了)。同样,当我用一个全局变量去引用pInfo数据的时候,那么在GetInfo函数中编译器无法对pInfo的操作则无法删除,因而保持原有的数据操作。
因此,会猛然增加5毫秒的时间。
此经验大家共享之,O(∩_∩)O哈哈~
luciferisnotsatan 2011-08-11
  • 打赏
  • 举报
回复
m_pcData = (*pInfo)->m_pcData;
如果是加了这个代码,多花了5毫秒。那么这个5毫秒和原来的x比起来,也是可以忽略不计的吧。
if (0 == GetInfo(pInfo)) 这里的消耗肯定远远大于上面的消耗
至善者善之敌 2011-08-11
  • 打赏
  • 举报
回复
代码很伪,看了半天,就写下这些了
luciferisnotsatan 2011-08-11
  • 打赏
  • 举报
回复
光看这伪代码,怎么知道如何优化。。。。。。
又不是伪码写了冒泡排序,可以告诉你用快排
品茶 2011-08-11
  • 打赏
  • 举报
回复
CXXINFO和CXX什么关系?
是CXX的子类?CXX的组合属性之一?还是其他?
CXX的m_pcData和CXXINFO的m_pcData类型完全一致吗?

CXXINFO的m_pcData是从CXX那继承的吗?

64,281

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧