社区
汇编语言
帖子详情
INTEL平台上的memcpy优化
编码人V1
2006-01-26 11:12:09
平台为PXA27x系列,用了一下IPP的拷贝函数,发现速度比直接用memcpy快不了多少,反汇编看了一下这个函数,没有用到INTEL自由的WMMX汇编指令。请问有什么函数能充分利用INTEL平台的特性进行拷贝吗?如果我用SIMD指令(WMMX指令)写一个汇编的拷贝函数,速度会快多少?
...全文
285
4
打赏
收藏
INTEL平台上的memcpy优化
平台为PXA27x系列,用了一下IPP的拷贝函数,发现速度比直接用memcpy快不了多少,反汇编看了一下这个函数,没有用到INTEL自由的WMMX汇编指令。请问有什么函数能充分利用INTEL平台的特性进行拷贝吗?如果我用SIMD指令(WMMX指令)写一个汇编的拷贝函数,速度会快多少?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ztedxj
2006-02-14
打赏
举报
回复
有和pxa27x配合的vtune
编码人V1
2006-01-26
打赏
举报
回复
vtune可以用在嵌入式上面吗?
醉马不肖
2006-01-26
打赏
举报
回复
你可以vtune侧一下
编码人V1
2006-01-26
打赏
举报
回复
大家都放假回家了?
memcpy
内存
优化
方法
内存拷贝的
优化
方法 http://www.blogcn.com/blog/cool/main.asp?uid=flier_lu&id=1577430 http://www.blogcn.com/blog/cool/main.asp?uid=flier_lu&id=1577440 在复杂的底层网络程序中,内存拷贝、字符串...
Linux内存分页导致
memcpy
慢,SIMD指令
优化
memcpy
函数
是在通用处理器上对程序性能进行
优化
的利器,尤其在进行大量数据进行相同操作时,更能凸显优势,在
Intel
X86家族中主要有MMX/SSE/SSE2等指令集构成。
memcpy
函数即从源地址向目的地址复制一块数据,利用SIMD对其
优化
...
DPDK中的
memcpy
性能
优化
及思考
内存拷贝(
memcpy
)这个操作看似简单,但长期以来存在很多关于其
优化
的讨论,各种编程语言库也都有对应实现,而对于
memcpy
性能评估测试的讨论就更多了。 那么如下的
memcpy
实现到底有什么问题? void * simple_
memcpy
...
fast
memcpy
memcpy
的性能一直没法
优化
,感觉一定有办法
优化
掉,通过查找和多方打听,得知Fast
Memcpy
可以解决此问题。git地址:https://gitee.com/yszs/Fast
Memcpy
.git。首先搞定了大内存频繁申请,使用tcmalloc。最近搞的东西...
关于gcc:当__builtin_
memcpy
替换为libc的
memcpy
时
有时,可以将其替换为内联版本的
memcpy
的GCC,而在其他情况下,可以通过调用libc的
memcpy
来替换。一段时间之前,我一直在尝试使用内置替换,但是发现函数仅在编译时可以知道source参数的大小时才替换。当大小为编译...
汇编语言
21,453
社区成员
41,602
社区内容
发帖
与我相关
我的任务
汇编语言
汇编语言(Assembly Language)是任何一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。
复制链接
扫一扫
分享
社区描述
汇编语言(Assembly Language)是任何一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章