社区
其它技术问题
帖子详情
是一次访存快,还是一次整数乘法快?
csdn5211
2009-04-30 10:36:35
按说访存是直接读数,可是,cpu从内存读数也是要耗时间的,也许还没有做一次整数乘法快呢?
...全文
201
10
打赏
收藏
是一次访存快,还是一次整数乘法快?
按说访存是直接读数,可是,cpu从内存读数也是要耗时间的,也许还没有做一次整数乘法快呢?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
10 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
猫已经找不回了
2009-04-30
打赏
举报
回复
访问内存的速度依赖不同的机器,但是数量级差不多。
随便举一个,一台网络处理器,XScale访问sram是200时钟,而dram是380 时钟。
而
XScale常见浮点运算的代价
运算类型 代价(时钟周期/个)
加法+ 400
乘法* 400
除法/ 500
所以浮点运算跟访问内存是同一数量级,那你整数运算,肯定快很多。
ps:某些机器有整数运算硬件单元,只需要一个时钟,更牛逼。
lingyin55
2009-04-30
打赏
举报
回复
没想过,帮顶下
darkwalkertt
2009-04-30
打赏
举报
回复
和内容存放的地方有关系吧?
mengde007
2009-04-30
打赏
举报
回复
俺认为乘法还是比较快的;
冷月清晖
2009-04-30
打赏
举报
回复
这个还真不知道,可以测试下。
一叶还真不知秋
2009-04-30
打赏
举报
回复
现在的CPU都有二级缓存,如果访问的内容在缓存内,那么这两种是一样快,都是耗一个时钟周期。否则的话,乘法可能更快一点。(计算器、手机、PDA等小玩意的CPU除外)
liao05050075
2009-04-30
打赏
举报
回复
这个不知道。。
可能不同的计算机会有不同的结果也不一定
猫已经找不回了
2009-04-30
打赏
举报
回复
[Quote=引用 8 楼 csdn5211 的回复:]
引用 7 楼 hairetz 的回复:
访问内存的速度依赖不同的机器,但是数量级差不多。
随便举一个,一台网络处理器,XScale访问sram是200时钟,而dram是380 时钟。
而
XScale常见浮点运算的代价
运算类型 代价(时钟周期/个)
加法+ 400
乘法* 400
除法/ 500
所以浮点运算跟访问内存是同一数量级,那你整数运算,肯定快很多。
ps:某些机器有整数运算硬件单元,只需要一个时钟,更牛逼。
加法和乘法居…
[/Quote]
这个是浮点运算的结果,整数运算,就不一定了。
小y正在思考人生
2009-04-30
打赏
举报
回复
真没想过~~
加法和乘法耗时一样!?!?学习了
csdn5211
2009-04-30
打赏
举报
回复
[Quote=引用 7 楼 hairetz 的回复:]
访问内存的速度依赖不同的机器,但是数量级差不多。
随便举一个,一台网络处理器,XScale访问sram是200时钟,而dram是380 时钟。
而
XScale常见浮点运算的代价
运算类型 代价(时钟周期/个)
加法+ 400
乘法* 400
除法/ 500
所以浮点运算跟访问内存是同一数量级,那你整数运算,肯定快很多。
ps:某些机器有整数运算硬件单元,只需要一个时钟,更牛逼。
[/Quote]
加法和乘法居然耗时一样!我一直以为加法一定比乘法快。
STM32F4硬件
乘法
加速提升运算性能
本文深入解析STM32F4内置的单周期硬件
乘法
器与FPU如何显著提升运算性能,涵盖
整数
乘法
、64位扩展、浮点加速及CMSIS-DSP库应用,并通过FOC电机控制实例展示在实时信号处理中的关键作用。
深入浅出
访存
优化
本文围绕C++开发中的内存与缓存性能优化展开。介绍了内存带宽,区分了cpu-bound与memory-bound,指出并行对两者的不同影响;阐述缓存与局域性,如缓存分级、工作机制等;还提及预取与直写、矩阵和莫顿码等优化方法,以及多核下缓存的伪共享问题及解决办法。
《高性能科学与工程计算》——第3章 数据
访存
优化3.1 平衡分析与lightspeed评估...
本文探讨了高性能计算中的
访存
优化问题,介绍了平衡分析和lightspeed评估方法,通过对比理论峰值性能与
访存
带宽,分析了不同处理器架构下的性能瓶颈。此外,文章还介绍了STREAM基准测试及其在评估内存接口性能中的应用。
【使用verilog、五级流水和MIPS指令集设计CPU】
本文基于《自己动手写CPU》书籍,分享了一款五级流水线处理器的设计,实现了约70条
整数
指令,使用Vivado开发。详细介绍了处理器的五级流水结构、各阶段模块设计与操作过程,包括取指、译码、执行、
访存
、回写,并展示了代码实现如pc_reg模块、Regfile模块等。
AVX2指令集浮点
乘法
性能分析
本文探讨了AVX2指令集在单精度和双精度浮点
乘法
中的性能优势,通过代码实现和性能测试,揭示了AVX2在处理浮点运算时的效率提升,以及为何整形运算优化效果不明显的原因。
其它技术问题
3,881
社区成员
9,044
社区内容
发帖
与我相关
我的任务
其它技术问题
C/C++ 其它技术问题
复制链接
扫一扫
分享
社区描述
C/C++ 其它技术问题
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章