FP寄存器及frame pointer介绍

1770阅读 0评论2016-10-02 L_502091250
分类:嵌入式

原文转自:http://blog.chinaunix.net/uid-25871104-id-2938389.html
原文作者:hubertx

理论上来说,ARM的15个通用寄存器是通用的,但实际上并非如此,特别是在过程调用的过程中。
PCS(Procedure Call Standard for Arm architecture)就定义了过程调用中,寄存器的特殊用途。

Role in the procedure call standard
r15 PC The Program Counter.
r14 LR The Link Register.
r13 SP The Stack Pointer.
r12 IP The Intra-Procedure-call scratch register. (可简单的认为暂存SP)

实际上,还有一个r11是optional的,被称为FP,即frame pointer。

1,stack frame
stack我们都知道,每一个进程都有自己的栈。考虑进程执行时发生函数调用的场景,母函数和子函数使用的是同一个栈,在通常的情况下,我们并不需要区分母函数和子函数分别使用了栈的哪个部分。但是,当我们需要在执行过程中对函数调用进行backtrace的时候,这一信息就很重要了。
简单的说,stack frame就是一个函数所使用的stack的一部分,所有函数的stack frame串起来就组成了一个完整的栈。stack frame的两个边界分别由FP和SP来限定。

2,backtrace
在程序执行过程中(通常是发生了某种意外情况而需要进行调试),通过SP和FP所限定的stack frame,就可以得到母函数的SP和FP,从而得到母函数的stack frame(PC,LR,SP,FP会在函数调用的第一时间压栈),以此追溯,即可得到所有函数的调用顺序。

3,gcc关于stack frame的优化选项
看起来FP只是在backtrace的时候有用,所以如果我们没有backstrace的需求,我们是否可以不使用FP。
其实gcc就有一个关于stack frame的优化选项:
-fomit-frame-pointer
=================================================================================
Don't keep the frame pointer in a register for functions that don't need one. This avoids the instructions to save, set up and restore frame pointers; it also makes an extra register available in many functions. It also makes debugging impossible on some machines.

On some machines, such as the VAX, this flag has no effect, because the standard calling sequence automatically handles the frame pointer and nothing is saved by pretending it doesn't exist. The machine-description macro "FRAME_POINTER_REQUIRED" controls whether a target machine supports this flag.

==================================================================================

这里引用别人关于这一参数的实验,自己就不做了。

从实验可以看出,优化后的差别是相当明显的。当然,具体能带来多大的性能提升,不好界定。

另外,x86中EBP寄存器相当于ARM中的FP寄存器。


==================================================================================

http://blog.csdn.net/byzs/article/details/2220461


环境:X86+Redhat 9.0,gcc 3.2.2

源文件如下:

$ cat test.c 
void a(unsigned long a, unsigned int b)
{
        unsigned long i;
        unsigned int j;

        i = a;
        j = b;

        i++;

        j += 2;

}

默认编译选项:
$ gcc -c test.c -o with_SFP.o

反汇编后是这个样子:
$ objdump -D with_SFP.o

with_SFP.o:     file format elf32-i386

Disassembly of section .text:

00000000 

上一篇:ATPCS规则详细
下一篇:没有了