【挑战极限】从BYTE数组到无符号整数间的转换效率

leechiyang 2011-11-08 11:55:52
unsigned char buf[] = {1,2,3,4};
int res;
//方式1
__asm
{
movzx eax,byte ptr [buf]
movzx ebx,byte ptr [buf+1]
movzx ecx,byte ptr [buf+2]
movzx edx,byte ptr [buf+3]
shl eax,18h
shl ebx,10h
shl ecx,8
or eax,ebx
or eax,ecx
or eax,edx
mov dword ptr [res],eax
}
//res得到0x01020304

//方式2
__asm
{
mov eax, DWORD PTR [buf]
rol ax, 8
rol eax, 16
rol ax, 8
mov res, eax
}
//res得到0x01020304


//方式3
__asm
{
mov eax, DWORD PTR [buf]
xchg al, ah
rol eax, 16
xchg al, ah
mov res, eax
}
//res得到0x01020304


方式1、方式2效率基本相当,方式3最慢,大概慢25%。

问题:何以导致第三那种方式最慢?最好的办法是哪种?有没有其他更好的办法?

...全文
204 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
leechiyang 2011-11-15
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 maozefa 的回复:]

mov eax, dword ptr[buf]
bswap eax
mov res, eax
[/Quote]

今天看IA32指令也看找到这个了,确实是最快的。
0xC0000000次循环只用了10秒,以前最快用11秒。要知道,其中8秒用在了计算循环条件上面。
G_Spider 2011-11-10
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 maozefa 的回复:]
bswap eax
[/Quote]
漂亮,专业。
阿发伯 2011-11-10
  • 打赏
  • 举报
回复
mov eax, dword ptr[buf]
bswap eax
mov res, eax
Areslee 2011-11-08
  • 打赏
  • 举报
回复
修正一下,是这样:
movzx eax,byte ptr [buf]
movzx ebx,byte ptr [buf+1]
shl eax,18h
shl ebx,10h
movzx ecx,byte ptr [buf+2]
or eax,ebx
shl ecx,8
movzx edx,byte ptr [buf+3]
or eax,ecx
or eax,edx
mov dword ptr [res],eax
Areslee 2011-11-08
  • 打赏
  • 举报
回复
试试这样如何:
movzx eax,byte ptr [buf]
movzx ebx,byte ptr [buf+1]
shl eax,18h
shl ebx,10h
movzx ecx,byte ptr [buf+2]
or eax,ebx
shl ecx,8
or eax,ecx
movzx edx,byte ptr [buf+3]
or eax,edx
mov dword ptr [res],eax
masmaster 2011-11-08
  • 打赏
  • 举报
回复
寄存器重复使用相关性太强,不利并行操作,影响效率。
G_Spider 2011-11-08
  • 打赏
  • 举报
回复
来一个,可能也差不多。
mov eax,dword ptr [buf]
mov edx,eax
shr eax,16
rol dx ,8
rol ax ,8
shl edx,16
or eax,edx
mov res,eax

xchg 影响效率,一致性方面用的多一点。
Areslee 2011-11-08
  • 打赏
  • 举报
回复
以前看的P5优化的书上说寄存器最好交错使用
leechiyang 2011-11-08
  • 打赏
  • 举报
回复
实测速度和第一种方式没什么区别。0xC0000000次循环需要11秒
把同样的指令分隔开执行是不是考虑到充分利用CPU的多条流水线?
软件编程规范培训实例与练习 软件编程规范培训实例与练习  问题分类 1 逻辑类问题(A类)-指设计、编码中出现的计算正确性和一致性、程序逻辑控制等方面出现的问题,在系统中起关键作用,将导致软件死机、功能正常实现等严重问题; 接口类问题(B类)-指设计、编码中出现的函数和环境、其他函数、全局/局部变量或数据变量之的数据/控制传输不匹配的问题,在系统中起重要作用,将导致模块配合失效等严重问题; 维护类问题(C类)-指设计、编码中出现的对软件系统的维护方便程度造成影响的问题,在系统中不起关键作用,但对系统后期维护造成不便或导致维护费用上升; 可测试性问题(D类)-指设计、编码中因考虑不周而导致后期系统可测试性差的问题。  处罚办法 问题发生率: P=D/S D=DA+0.5DB+0.25DC 其中: P -问题发生率 D -1个季度内错误总数 DA -1个季度内A类错误总数 DB -1个季度内B类错误总数 DC -1个季度内C类错误总数 S -1个季度内收到问题报告单总数 1)当D≥3时,如果P≥3%,将进行警告处理,并予以公告; 2)当D≥5时,如果P≥5%,将进行罚款处理,并予以公告。 目 录 一、逻辑类代码问题 第5页 1、变量/指针在使用前就必须初始化 第5页 【案例1.1.1】 第5页 2、防止指针/数组操作越界 第5页 【案例1.2.1】 第5页 【案例1.2.2】 第6页 【案例1.2.3】 第7页 【案例1.2.4】 第8页 3、避免指针的非法引用 第9页 【案例1.3.1】 第9页 4、变量类型定义错误 第10页 【案例1.4.1】 第10页 5、正确使用逻辑与&&、屏蔽&操作符 第17页 【案例1.5.1】 第17页 6、注意数据类型的匹配 第18页 【案例1.6.1】 第18页 【案例1.6.2】 第18页 7、用于控制条件转移的表达式及取值范围是否书写正确 第20页 【案例1.7.1】 第20页 【案例1.7.2】 第21页 【案例1.7.3】 第22页 8、条件分支处理是否有遗漏 第24页 【案例1.8.1】 第24页 9、引用已释放的资源 第26页 【案例1.9.1】 第26页 10、分配资源是否已正确释放 第28页 【案例1.10.1】 第28页 【案例1.10.2】 第29页 【案例1.10.3】 第30页 【案例1.10.4】 第32页 【案例1.10.5】 第33页 【案例1.10.6】 第35页 【案例1.10.7】 第38页 11、防止资源的重复释放 第39页 【案例1.11.1】 第39页 12、公共资源的互斥性和竞用性 第40页 【案例1.12.1】 第40页 【案例1.12.2】 第40页 二、接口类代码问题 第43页 1、对函数参数进行有效性检查 第43页 【案例2.1.1】 第43页 【案例2.1.2】 第43页 【案例2.1.3】 第44页 【案例2.1.4】 第46页 【案例2.1.5】 第47页 【案例2.1.6】 第48页 2、注意多出口函数的处理 第49页 【案例2.2.1】 第49页 三、维护类代码问题 第51页 1、 统一枚举类型的使用 第51页 【案例3.1.1】 第51页 2、 注释量至少占代码总量的20% 第51页 【案例3.2.1】对XXX产品BAM某版本部分代码注释量的统计 第51页 四、产品兼容性问题 第52页 1、系统配置、命令方式 第52页 【案例4.1.1】 第52页 【案例4.1.2】 第53页 2、设备对接 第54页 【案例4.2.1】 第54页 3、其他 第55页 【案例4.3.1】 第55页 五、版本控制问题 第58页 1、新老代码中同一全局变量不一致 第58页 【案例5.1.1】 第58页 六、可测试性代码问题 第59页 1、调试信息/打印信息的正确性 第59页 【案例6.1.1】 第59页 一、逻辑类代码问题 1、变量/指针在使用前就必须初始化 【案例1.1.1】 C语言中最大的特色就是指针。指针的使用具有很强的技巧性和灵活性,但同时也带来了很大的危险性。在XXX的代码中有如下一端对指针的灵活使用: ... ... _UC *puc_card_config_tab; ... ... Get_Config_Table(

21,458

社区成员

发帖
与我相关
我的任务
社区描述
汇编语言(Assembly Language)是任何一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。
社区管理员
  • 汇编语言
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧