社区
驱动开发/核心开发
帖子详情
达芬奇DSP算法很慢的问题
超龄编码人
2010-06-06 09:45:15
问题是这样,我用videnc_copy修改,加入我的放大算法代码,在process里面要用到width height pitch等值,
要传参数,我把这些变量放到process里面声明称局部变量并赋初值,程序就跑的很快(20ms),但是我把这几个变量
复制到process的外面(全局变量并赋初值),程序就跑的很慢了(170ms)。
请教是什么原因
...全文
301
9
打赏
收藏
达芬奇DSP算法很慢的问题
问题是这样,我用videnc_copy修改,加入我的放大算法代码,在process里面要用到width height pitch等值, 要传参数,我把这些变量放到process里面声明称局部变量并赋初值,程序就跑的很快(20ms),但是我把这几个变量 复制到process的外面(全局变量并赋初值),程序就跑的很慢了(170ms)。 请教是什么原因
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
超龄编码人
2010-06-14
打赏
举报
回复
我的理解是基于这样一个事实,TI的这个dsp可以达到8级流水线,也就是说在一个周期可以并行处理八个指令,如果最优的流程就是每个循环次数里面可以可以执行八个指令,包括上一个循环的后续指令和下一个循环的取指译码等指令,这样的话道下一个循环就不用译码了直接可以执行还可以在取下下一条指令。这样就相当效率提高了8倍。而最差的就是一个周期做一件事情,
brookmill
2010-06-09
打赏
举报
回复
[Quote=引用 7 楼 disikj 的回复:]
问题还没有解决,不过根据我这几天来的实验来分析,估计问题是这样,
编译器如果发现循环中用的变量是确定的值,那么在编译的时候循环的次数已经确定了那么会生成确定的执行流程,编译器可以编译成最优的效果,但是如果在循环中有些变量的值不确定,编译器也就不知道循环要执行多少次和其他一些信息,所以只能编译成保守的执行流程,这样就慢了,
[/Quote]
这个我只能同意一部分。
如果只是根据确定的循环次数来做优化,会有一些效果,但是我想不会有那么明显,特别是循环次数很多的情况下。
对于 for(i=0; i<width; i++)
我觉得效果来自于这个比较i<width
如果width是全局变量或者栈上的局部变量,那这里就需要访问内存,结果降低效率。
如果width是保存在寄存器的局部变量,就就快多了。
如果编译器发现width是确定值而把它优化成立即数,那也会很快。不过我不太确定有没有这种优化。
超龄编码人
2010-06-09
打赏
举报
回复
问题还没有解决,不过根据我这几天来的实验来分析,估计问题是这样,
编译器如果发现循环中用的变量是确定的值,那么在编译的时候循环的次数已经确定了那么会生成确定的执行流程,编译器可以编译成最优的效果,但是如果在循环中有些变量的值不确定,编译器也就不知道循环要执行多少次和其他一些信息,所以只能编译成保守的执行流程,这样就慢了,
Peasant_Lee
2010-06-06
打赏
举报
回复
存储地方不一样,全局变量一般都在静态存储区,局部的话,栈和寄存器都有可能,他们的读取时间有区别的。。差别这么大,可能是楼主经常用到那三个变量。积少成多。。。。
brookmill
2010-06-06
打赏
举报
回复
局部变量和函数参数都可能会保存在寄存器里,而全局变量就不行。
brookmill
2010-06-06
打赏
举报
回复
比如arm的ATPCS标准,r4到r11这么多寄存器都可以用来保存局部变量
brookmill
2010-06-06
打赏
举报
回复
编译器优化?楼主看看汇编代码吧。
某些平台的编译器可能会用寄存器来保存局部变量,就会比较快。不知道会不会差这么多,20到170差太多了。
楼主用的什么系统?
ywc86196225
2010-06-06
打赏
举报
回复
应该是你的编译器问题把
shine487
2010-06-06
打赏
举报
回复
学习了
DSP
:
达芬奇
五年沉浮
达芬奇
五年沉浮 ——嵌入式处理器架构之争决战2012 在DM642时代,是“一招鲜,吃遍天”。只有一颗处理器,无论客户做多少个产品线,多少种产品,只用维护一种开发环境和软件,只用保持为数不多的一个BOM 清单即可;可是到了
达芬奇
时代,DM644x
算法
买不起,自己做吧,还没做完,DM357出来了。跟进TI的烈士们,累的跳楼的心都有了…… 序: 芯片是产业链上游重要的一
DSP
+FPGA的前景及应用调研
DSP
+FPGA处理系统正广泛应用于复杂的信号处理领域。在雷达信号处理、数字图像处理等领域中,信号处理的实时性至关重要。由于FPGA芯片在大数据量的底层
算法
处理上的优势及
DSP
芯片在复杂
算法
处理上的优势,
DSP
+FPGA的实时信号处理系统的应用越来越广泛。
DSP
的主要优点是,可编程,成本低,现有人才多。 FPGA的优点是:高性能,但其也是以高成本为代价的。然后又是硬件设计,周期长,会的...
DM644x
达芬奇
平台交叉编译工具链的制作
最近在做davinci平台的系统开发,用的是ti公司的dm6446芯片,这款芯片比较经典所以资料也挺多的,而且ti官方给提供一个dvsdk的软件包,里面包含了包括bootloader、kernel、fs、
DSP
算法
及各种编解码codec,可谓给开发者提供了很多便利。当然里面也包含了arm-linux的交叉编译工具链,但是版本比较旧了,是基于gcc-4.2.0版本的,现在最新的gcc的版本已经到了4
【
DSP
开发】德州仪器
达芬奇
五年之路七宗罪,嵌入式处理器架构之争决战2012
芯片是产业链上游重要的一个环节,一颗小小的芯片具有极高的技术含量和价值,半导体行业每年都会有一个各大厂商营业额的排名,除去2009年,常年盘踞在前三名位置的分别是英特尔,三星半导体和德州仪器,英特尔凭借的是桌面处理器,三星半导体凭借的是其全面的存储器产品线,德州仪器则是凭借模拟器件,嵌入式处理器和无线半导体这“三驾马车”。(注:DLP应隶属于光电器件,所以未计入) 终端是产业链中上游重要的一
DSP
:数字信号处理(Digital Signal Processing)
目录 数字信号处理
DSP
微处理器 轻松体验
DSP
DSP
技术 中国
DSP
市场现状
DSP
未来发展 Windows系统
DSP
文件扩展名:
DSP
磷酸氢二钠:
DSP
DSP
的应用
DSP
的优缺点: 磷酸氢二钠:
DSP
DSP
的应用
DSP
的优缺点: [编辑本段]数字信号处理
DSP
数字信号处理(Digital Signal Processing,简称D
驱动开发/核心开发
21,597
社区成员
21,709
社区内容
发帖
与我相关
我的任务
驱动开发/核心开发
硬件/嵌入开发 驱动开发/核心开发
复制链接
扫一扫
分享
社区描述
硬件/嵌入开发 驱动开发/核心开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章