没有合适的资源?快使用搜索试试~ 我知道了~
首页DSP程序优化方法.pdf
DSP程序优化方法.pdf
需积分: 9 39 浏览量
更新于2023-03-03
评论
收藏 182KB PDF 举报
适合搞DSP优化得同志们,里面介绍的详细。当然还需要自己多动手,多思考。加油吧。。
资源详情
资源评论
资源推荐

DSP 程序优化方法 (1)
1 、选择合适的算法和数据结构
选择一种合适的数据结构很重要, 如果在一堆随机存放的数中使用了大量的插入和删 除
指令,那使用链表要快得多。数组与指针语句具有十分密切的关系,一般来说,指针比较 灵
活简洁,而数组则比较直观,容易理解。对于大部分的编译器,使用指针比使用数组生成 的
代码更短,执行效率更高。
在许多种情况下,可以用指针运算代替数组索引,这样做常常能产生又快又短的代码。
与数组索引相比, 指针一般能使代码速度更快, 占用空间更少。 使用多维数组时差异更明
显。
下面的代码作用是相同的,但是效率不一样。
数组索引 指针运算
For(;;){ p=array
A=array[t++]; for(;;){
a=*(p++);
。。。。。。。。。
。。 。 。 。 。
} }
指针方法的优点是, array 的地址每次装入地址 p 后,在每次循环中只需对 p 增量操作
。
在数组索引方法中,每次循环中都必须根据 t 值求数组下标的复杂运算。
2 、使用尽量小的数据类型
能够使用字符型 (char) 定义的变量,就不要使用整型 (int) 变量来定义;能够使用整
型变量定义的变量就不要用长整型 (long int) ,能不使用浮点型 (float) 变量就不要使用浮
点型变量。 当然, 在定义变量后不要超过变量的作用范围, 如果超过变量的范围赋值, C 编
译器并不报错,但程序运行结果却错了,而且这样的错误很难发现。
在 ICCAVR
中, 可以在
Options 中设定使用 printf 参数, 尽量使用基本型参数 (%c
、
%d
、
%x
、
%X
、
%u 和 %s 格式说明符 ) , 少用长整型参数 (%ld
、
%lu
、
%lx 和
%lX 格式说明符 ) ,至于浮点型的参数 (%f) 则尽量不要使用,其它 C 编译器也一样。
在其它条件不变的情况下,使用 %f 参数,会使生成的代码的数量增加很多,执行速度降
低。
3 、减少运算的强度
( 1
) 、查表
( 游戏程序员必修课 )
一个聪明的游戏大虾,基本上不会在自己的主循环里搞什么运算工作,绝对是先计算好了,
再到循环里查表。看下面的例子:
旧代码:
long factorial(int i)
{

if (i == 0)
return
1;
else
return i * factorial(i - 1);
}
新代码:
static long factorial_table[] =
{1 , 1 , 2 , 6 , 24 , 120 , 720 /* etc */
};
long factorial(int i)
{
return factorial_table;
}
如果表很大,不好写,就写一个 init 函数,在循环外临时生成表格。
( 2
) 、求余运算
a=a%8;
可以改为:
a=a&7;
说明:位操作只需一个指令周期即可完成,而大部分的 C 编译器的 “ % ” 运算均是调用
子程序来完成,代码长、执行速度慢。通常, 只要求是求 2n 方的余数,均可使用位操作
的方法来代替。
( 3
) 、平方运算
a=pow(a, 2.0);
可以改为:

a=a*a;
说明:在有内置硬件乘法器的单片机中 ( 如 51 系列 ) ,乘法运算比求平方运算快得多,
因为浮点数的求平方是通过调用子程序来实现的,在自带硬件乘法器的
AVR
单片机中, 如
ATMega163 中, 乘法运算只需 2 个时钟周期就可以完成。 既使是在没有内置硬件乘法器 的
AVR
单片机中,乘法运算的子程序比平方运算的子程序代码短,执行速度快。
如果是求
3
次方,如:
a=pow(a ,
3
。 0);
更改为:
a=a*a*a ;
则效率的改善更明显。
( 4 ) 、用移位实现乘除法运算
a=a*4;
b=b/4;
可以改为:
a=a<<2;
b=b>>2;
通常如果需要乘以或除以 2n , 都可以用移位的方法代替。在
ICCAVR
中,如果乘以 2n
,
都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位 的
方法得到代码比调用乘除法子程序生成的代码效率高。 实际上, 只要是乘以或除以一个整
数,
均可以用移位的方法得到结果,如:
a=a*9
可以改为:
a=(a<<3)+a
采用运算量更小的表达式替换原来的表达式,下面是一个经典例子 :
旧代码 :

x = w %
8;
y = pow(x , 2.0);
z
= y * 33;
for (i = 0;i < MAX;i++)
{
h = 14 *
i;
printf("%d" , h);
}
新代码 :
x = w &
7;
/* 位操作比求余运算快 */
y = x *
x;
/* 乘法比平方运算快 */
z
= (y << 5) +
y;
/* 位移乘法比乘法快 */
for (i = h =
0;
i < MAX; i++)
{
h += 14; /* 加法比乘法快 */
printf("%d" , h);
}
( 5 ) 、避免不必要的整数除法
整数除法是整数运算中最慢的, 所以应该尽可能避免。 一种可能减少整数除法的地方 是
连除,这里除法可以由乘法代替。这个替换的副作用是有可能在算乘积时会溢出,所以只 能
在一定范围的除法中使用。
不好的代码:
int i , j , k , m ;

m = i / j / k ;
推荐的代码:
int i , j , k , m ;
m = i / (j * k) ;
( 6 ) 、使用增量和减量操作符
在使用到加一和减一操作时尽量使用增量和减量操作符, 因为增量符语句比赋值语句 更
快,原因在于对大多数 CPU 来说,对内存字的增、减量操作不必明显地使用取内存和写 内
存的指令,比如下面这条语句:
x=x+1;
模仿大多数微机汇编语言为例,产生的代码类似于:
move
A
, x
;
把 x 从内存取出存入累加器
A
add
A
, 1
;
累加器
A
加 1
store x
;
把新值存回 x
如果使用增量操作符,生成的代码如下:
incr x ;x 加 1
显然,不用取指令和存指令,增、减量操作执行的速度加快,同时长度也缩短了。
( 7 ) 、使用复合赋值表达式
复合赋值表达式 ( 如 a-=1 及 a+=1 等 ) 都能够生成高质量的程序代码。
( 8 ) 、提取公共的子表达式
在某些情况下, C++ 编译器不能从浮点表达式中提出公共的子表达式,因为这意味着相 当
于对表达式重新排序。 需要特别指出的是, 编译器在提取公共子表达式前不能按照代数的 等
价关系重新安排表达式。这时,程序员要手动地提出公共的子表达式(在 VC.NET 里有一
项 “ 全局优化 ” 选项可以完成此工作,但效果就不得而知了) 。
不好的代码:
float a , b , c , d , e , f ;
剩余27页未读,继续阅读







安全验证
文档复制为VIP权益,开通VIP直接复制

评论0