内存对齐问题

4280阅读 2评论2013-03-19 luotaijia
分类:C/C++


一. 计算机为什么要使用内存对齐机制?
1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。访问未对齐的内存,处理器需要作两次内存访问,而对齐的内存访问仅需要一次访问。(提高对数据的读取效率,以空间换时间)

二. 对齐规则
    1每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。比如32位windows平台下,VC默认是按照bytes对齐的 (VC->Project->settings->c/c++->Code Generation中的truct member alignment 值默认是8),程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16 来改变这一系数,其中的n就是你要指定的“对齐系数”。
规则:
    (1).数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行。
    (2).结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
    (3).结合1、2颗推断:当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。

示例: 所用编译器包括GCC 3.4.2和VC6.0的C编译器,平台为Windows XP + Sp2
    
1.字节对齐 (#pragma pack(1))输出结果:sizeof(struct test_t) = 13 [两个编译器输出一致]
    分析过程:
        1) 成员数据对齐
            struct test_t {
                int a; /* int型,长度4 > 1 按1对齐;起始offset=0 0%1=0;存放位置区间[0,3] */
                char b; /* char型,长度1 = 1 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */
                short c; /* short型,长度2 > 1 按1对齐;起始offset=5 5%1=0;存放位置区间[5,6] */
                char d[6]; /* char型,长度1 = 1 按1对齐;起始offset=7 7%1=0;存放位置区间[7,C] */
            };/*char d[6]要看成6个char型变量*/
        2) 整体对齐
            整体对齐系数 = min((max(int,short,char), 1) = 1
            整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 13   /*13%1=0*/
    2.字节对齐 (#pragma pack(2)), 输出结果:sizeof(struct test_t) = 14 [两个编译器输出一致]
    分析过程:
        1) 成员数据对齐
            struct test_t {
                int a; /* int型,长度4 > 2 按2对齐;起始offset=0 0%2=0;存放位置区间[0,3] */
                char b; /* char型,长度1 < 2 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */
                short c; /* short型,长度2 = 2 按2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */
                char d[6]; /* char型,长度1 < 2 按1对齐;起始offset=8 8%1=0;存放位置区间[8,D] */
            };
    2) 整体对齐
        整体对齐系数 = min((max(int,short,char), 2) = 2
        整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 14 
      2. 在嵌入式环境下,对齐往往与数据类型有关,特别是C编译器对缺省的结构成员自然对届条件为“N字节对齐”,N即该成员数据类型的长度。如int型成员的自然对界条件为4字节对齐,而double类型的结构成员的自然对界条件为8字节对齐。若该成员的起始偏移不位于该成员的“默认自然对界条件”上,则在前一个节面后面添加适当个数的空字节。C编译器缺省的结构整体的自然对界条件为:该结构所有成员中要求的最大自然对界条件。若结构体各成员长度之和不为“结构整体自然对界条件的整数倍,则在最后一个成员后填充空字节。


    那么可以得到如下的小结:

    类型             对齐方式(变量存放的起始地址相对于结构的起始地址的偏移量)
    Char            偏移量必须为sizeof(char)即1的倍数
    Short           偏移量必须为sizeof(short)即2的倍数
     int              偏移量必须为sizeof(int)即4的倍数
    float             偏移量必须为sizeof(float)即4的倍数
   double          偏移量必须为sizeof(double)即8的倍数

      各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对齐方式调整位置,空缺的字节编译器会自动填充。同时为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节,也就是说:结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节。对于char数组,字节宽度仍然认为为1。

    对于下述的一个结构体,其对齐方式为:

    typedef struct{ double m1;   char m2;  int m3; }Node1;

      对于第一个变量m1,sizeof(double)=8个字节;接下来为第二个成员m2分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数,所以把m2存放在偏移量为8的地方满足对齐方式,该成员变量占用 sizeof(char)=1个字节;接下来为第三个成员m3分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为9,不是sizeof (int)=4的倍数,为了满足对齐方式对偏移量的约束问题,自动填充3个字节(这三个字节没有放什么东西),这时下一个可以分配的地址对于结构的起始地址的偏移量为12,刚好是sizeof(int), 由于8+4+4 = 16恰好是结构体中最大空间类型double(8)的倍数,所以sizeof(Node1) =16.

    typedef struct{  char a;    int b;    char c;  }Node2;

      成员a占一个字节,所以a放在了第1位的位置;由于第二个变量b占4个字节,为保证起始位置是4(sizeof(b))的倍数,所以需要在a后面填充3个字节,也就是b放在了从第5位到第8位的位置,然后就是c放在了9的位置,此时4+4+1=9。接下来考虑字节边界数,9并不是最大空间类型int(4)的倍数,应该取大于9且是4的的最小整数12,所以sizeof(Node2) = 12.
    typedef struct{  char a;   char b;  int c; }Node3;

   明显地:sizeof(Node3) = 8

   对于结构体A中包含结构体B的情况,将结构体A中的结构体成员B中的最宽的数据类型作为该结构体成员B的数据宽度,同时结构体成员B必须满足上述对齐的规定。

上一篇:linux下如何解压文件压缩包
下一篇:做到以下15点

文章评论