为什么在64位系统下异或比在32位系统下更慢?

Sandrer 2015-03-01 11:44:10

    DWORD_PTR dwSize = (512 << 10) << 10;

    DWORD_PTR dwXor = 0x1248F842;

    if (sizeof(dwXor) == 8)

        dwXor = 0x1248F8421248F842;

    BYTE *pTestData = new BYTE[dwSize];

    DWORD dwXorTimer = GetTickCount();

    for (DWORD_PTR i = 0; i < dwSize / sizeof(DWORD_PTR); i++)

        *((DWORD_PTR *)pTestData + i) ^= dwXor;

    TRACE1("Timer: %d\n", GetTickCount() - dwXorTimer);

上面的代码，在32位下编译运行用时350毫秒
但在64位下居然用了600毫秒

为什么会这样的？64位下每次用8字节异或居然比32位每次4字节更慢的？

如果把 DWORD_PTR 改成 DWORD 然后在64位下编译运行则更慢，这个原因我知道所以不讨论这个

...全文

286 10 打赏收藏转发到动态举报

写回复

用AI写文章

10 条回复

切换为时间正序

请发表友善的回复…

发表回复

Sandrer 2015-03-02

打赏
举报

引用 7 楼 worldy 的回复:

lz的代码好像都是32位吧，64位的应该是long long

DWORD_PTR 在 64 位下会变成 8 字节的

#if defined(_WIN64)
    typedef __int64 INT_PTR, *PINT_PTR;
    typedef unsigned __int64 UINT_PTR, *PUINT_PTR;

    typedef __int64 LONG_PTR, *PLONG_PTR;
    typedef unsigned __int64 ULONG_PTR, *PULONG_PTR;

    #define __int3264   __int64

#else
    typedef _W64 int INT_PTR, *PINT_PTR;
    typedef _W64 unsigned int UINT_PTR, *PUINT_PTR;

    typedef _W64 long LONG_PTR, *PLONG_PTR;
    typedef _W64 unsigned long ULONG_PTR, *PULONG_PTR;

    #define __int3264   __int32

#endif

typedef ULONG_PTR DWORD_PTR, *PDWORD_PTR

赵4老师 2015-03-02

打赏
举报

无profiler不要谈效率！！尤其在这个云计算、虚拟机、模拟器、CUDA、多核、多级cache、指令流水线、多种存储介质、……满天飞的时代！

赵4老师 2015-03-02

打赏
举报

楼主生成的是Release版吗？

worldy 2015-03-01

打赏
举报

lz的代码好像都是32位吧，64位的应该是long long

Sandrer 2015-03-01

打赏
举报

#include <Windows.h>

#pragma comment(lib, "kernel32.lib")

void main()
{
    DWORD_PTR dwIndex;
    DWORD_PTR dwSize;
    DWORD_PTR dwXor;
    DWORD dwTimer;
    BYTE *pTestData;
    TCHAR szOutput[32];

    dwSize = (512 << 10) << 10;

    dwXor = 0x1248F842;
    if (sizeof(dwXor) == 8)
        dwXor = (DWORD_PTR)0x1248F8421248F842;

    pTestData = (BYTE *)LocalAlloc(LMEM_ZEROINIT, dwSize);

    dwTimer = GetTickCount();
    for (dwIndex = 0; dwIndex < dwSize / sizeof(DWORD_PTR); dwIndex++)
        *((DWORD_PTR *)pTestData + dwIndex) ^= dwXor;
    dwTimer = GetTickCount() - dwTimer;

    LocalFree(pTestData);

    wsprintf(szOutput, TEXT("Timer: %d"), dwTimer);
    MessageBox(NULL, szOutput, TEXT("test"), MB_ICONINFORMATION);
}

刚刚在 vs2010 下编写重新编写的代码，纯c编译 32位和64位结果可以说是一样，上下浮动10毫秒奇怪了....................

Sandrer 2015-03-01

打赏
举报

引用 3 楼 zwfgdlc 的回复:

什么编译器? 我用VC2008SP1试了下,64位要快点.

vs2010旗舰版.........

Sandrer 2015-03-01

打赏
举报

引用 2 楼 zgl7903 的回复:

猜测可能和数据字节对齐位置有关, 还有可能就是64位访问的时候安全检测项多还有可能有杀毒软件啥的在监控进程

64位下默认8字节对齐，DWORD_PTR 在32位下是4字节、64位下是8字节，所以应该不是与字节对齐有关看了下汇编，比32位多了几个指令，寄存器从 e*x 换成了 r*x，其它也没看到有什么 call 什么其它函数啊刚才在win7 64位的虚拟机里测试了下，就光一个系统其它啥都没有，速度也是差不多啊，所以跟监控也应该无关吧纠结啊..........难道是cpu的原因？