关于字节对齐的问题

omrhal 2004-11-26 10:06:54

我们知道，按照字节对齐方式的不同，数据结构所占据的存储空间就不同。
比如说假如按照四字节对齐
struct
{
char a;
short b;
int c;
}
和
struct
{
char a;
int b;
short c;
}
所占的空间就是不一样的。
所以有时候在程序里存在字节不对齐的时候有可能会出现地址访问错误的问题。
请问哪位老大有这方面的详细资料。或者能给详细讲解一下mipscpu是怎么对内存进行访问的。
100分奉上，多谢！！！

...全文

980 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

lovessm 2004-12-09

打赏
举报

把下面的程序，运行一下，应该就很清楚了

#pragma pack(push, 1) /* 后面可改为1, 2, 4, 8 */

struct structure
{
char m1;
long m2;
};

#pragma pack(pop)

int main()
{
char a;
char b;
char c;
char d[2];
struct structure s;

a;b;c;s;d;

printf("a address: [%x]\n", &a);
printf("b address: [%x]\n", &b);
printf("c address: [%x]\n", &c);
printf("d[0] addr: [%x]\n", &(d[0]));
printf("d[1] addr: [%x]\n", &(d[1]));
printf("s address: [%x]\n", &s);
printf("s.m2 addr: [%x]\n", &(s.m2));

return 0;
}

realee 2004-12-08

打赏
举报

mark,解释的不错

DiabloWalkOnTheEarth 2004-11-29

打赏
举报

同意楼上, RISC的处理器一般都必须内存对齐,16位数据必须2字节对齐,32位数据必须4字节对齐,否则会访问异常.

mathe 2004-11-29

打赏
举报

有些cpu（好像包括MIPS),是只允许内存对齐访问的。也就是说，如果我们要访问
一个32比特的整数(int),那么，这个数据的地址必须是4的倍数，不然就会出现内存
访问异常。所以在这些机器上面，如果使用了内存不对齐的存储方式，就必须自己来
特殊处理，而通过编译器产生的代码可能会引起unaligned memory的异常。

BMI 2004-11-27

打赏
举报

[转]什么是内存对齐

考虑下面的结构：

struct foo
{
char c1;
short s;
char c2;
int i;
};

假设这个结构的成员在内存中是紧凑排列的，假设c1的地址是0，那么s的地址就应该是1，c2的地址就是3，i的地址就是4。也就是
c1 00000000, s 00000001, c2 00000003, i 00000004。

可是，我们在Visual c/c++ 6中写一个简单的程序：

struct foo a;
printf("c1 %p, s %p, c2 %p, i %p\n",
(unsigned int)(void*)&a.c1 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.s - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.c2 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.i - (unsigned int)(void*)&a);
运行，输出：
c1 00000000, s 00000002, c2 00000004, i 00000008。

为什么会这样？这就是内存对齐而导致的问题。

为什么会有内存对齐

以下内容节选自《Intel Architecture 32 Manual》。
字，双字，和四字在自然边界上不需要在内存中对齐。（对字，双字，和四字来说，自然边界分别是偶数地址，可以被4整除的地址，和可以被8整除的地址。）
无论如何，为了提高程序的性能，数据结构（尤其是栈）应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；然而，对齐的内存访问仅需要一次访问。
一个字或双字操作数跨越了4字节边界，或者一个四字操作数跨越了8字节边界，被认为是未对齐的，从而需要两次总线周期来访问内存。一个字起始地址是奇数但却没有跨越字边界被认为是对齐的，能够在一个总线周期中被访问。
某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐，这些指令将会产生一个通用保护异常（#GP）。双四字的自然边界是能够被16整除的地址。其他的操作双四字的指令允许未对齐的访问（不会产生通用保护异常），然而，需要额外的内存总线周期来访问内存中未对齐的数据。

编译器对内存对齐的处理

缺省情况下，c/c++编译器默认将结构、栈中的成员数据进行内存对齐。因此，上面的程序输出就变成了：
c1 00000000, s 00000002, c2 00000004, i 00000008。
编译器将未对齐的成员向后移，将每一个都成员对齐到自然边界上，从而也导致了整个结构的尺寸变大。尽管会牺牲一点空间（成员之间有空洞），但提高了性能。
也正是这个原因，我们不可以断言sizeof(foo) == 8。在这个例子中，sizeof(foo) == 12。

如何避免内存对齐的影响

那么，能不能既达到提高性能的目的，又能节约一点空间呢？有一点小技巧可以使用。比如我们可以将上面的结构改成：

struct bar
{
char c1;
char c2;
short s;
int i;
};
这样一来，每个成员都对齐在其自然边界上，从而避免了编译器自动对齐。在这个例子中，sizeof(bar) == 8。

这个技巧有一个重要的作用，尤其是这个结构作为API的一部分提供给第三方开发使用的时候。第三方开发者可能将编译器的默认对齐选项改变，从而造成这个结构在你的发行的DLL中使用某种对齐方式，而在第三方开发者哪里却使用另外一种对齐方式。这将会导致重大问题。
比如，foo结构，我们的DLL使用默认对齐选项，对齐为
c1 00000000, s 00000002, c2 00000004, i 00000008，同时sizeof(foo) == 12。
而第三方将对齐选项关闭，导致
c1 00000000, s 00000001, c2 00000003, i 00000004，同时sizeof(foo) == 8。

如何使用c/c++中的对齐选项

vc6中的编译选项有 /Zp[1|2|4|8|16] ，/Zp1表示以1字节边界对齐，相应的，/Zpn表示以n字节边界对齐。n字节边界对齐的意思是说，一个成员的地址必须安排在成员的尺寸的整数倍地址上或者是n的整数倍地址上，取它们中的最小值。也就是：
min ( sizeof ( member ), n)
实际上，1字节边界对齐也就表示了结构成员之间没有空洞。
/Zpn选项是应用于整个工程的，影响所有的参与编译的结构。
要使用这个选项，可以在vc6中打开工程属性页，c/c++页，选择Code Generation分类，在Struct member alignment可以选择。

要专门针对某些结构定义使用对齐选项，可以使用#pragma pack编译指令。指令语法如下：
#pragma pack( [ show ] | [ push | pop ] [, identifier ] , n )
意义和/Zpn选项相同。比如：

#pragma pack(1)
struct foo_pack
{
char c1;
short s;
char c2;
int i;
};
#pragma pack()

栈内存对齐

我们可以观察到，在vc6中栈的对齐方式不受结构成员对齐选项的影响。（本来就是两码事）。它总是保持对齐，而且对齐在4字节边界上。

验证代码

#include <stdio.h>

struct foo
{
char c1;
short s;
char c2;
int i;
};

struct bar
{
char c1;
char c2;
short s;
int i;
};

#pragma pack(1)
struct foo_pack
{
char c1;
short s;
char c2;
int i;
};
#pragma pack()

int main(int argc, char* argv[])
{
char c1;
short s;
char c2;
int i;

struct foo a;
struct bar b;
struct foo_pack p;

printf("stack c1 %p, s %p, c2 %p, i %p\n",
(unsigned int)(void*)&c1 - (unsigned int)(void*)&i,
(unsigned int)(void*)&s - (unsigned int)(void*)&i,
(unsigned int)(void*)&c2 - (unsigned int)(void*)&i,
(unsigned int)(void*)&i - (unsigned int)(void*)&i);

printf("struct foo c1 %p, s %p, c2 %p, i %p\n",
(unsigned int)(void*)&a.c1 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.s - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.c2 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.i - (unsigned int)(void*)&a);

printf("struct bar c1 %p, c2 %p, s %p, i %p\n",
(unsigned int)(void*)&b.c1 - (unsigned int)(void*)&b,
(unsigned int)(void*)&b.c2 - (unsigned int)(void*)&b,
(unsigned int)(void*)&b.s - (unsigned int)(void*)&b,
(unsigned int)(void*)&b.i - (unsigned int)(void*)&b);

printf("struct foo_pack c1 %p, s %p, c2 %p, i %p\n",
(unsigned int)(void*)&p.c1 - (unsigned int)(void*)&p,
(unsigned int)(void*)&p.s - (unsigned int)(void*)&p,
(unsigned int)(void*)&p.c2 - (unsigned int)(void*)&p,
(unsigned int)(void*)&p.i - (unsigned int)(void*)&p);

printf("sizeof foo is %d\n", sizeof(foo));
printf("sizeof bar is %d\n", sizeof(bar));
printf("sizeof foo_pack is %d\n", sizeof(foo_pack));

return 0;
}
正文完

omrhal 2004-11-26

打赏
举报

谢谢楼上的，这样的话应该不用考虑字节对齐的问题。但是我现在用的cpu不是intel的，所以内存分配的方式有所不同。当然我可以用pack(1)使其按1字节对齐，但是我想知道具体的寄存器对数据的存取机制是怎样的。

NNBWOLF 2004-11-26

打赏
举报

VC++编译器里面有个成员结构字节对齐为8字节不要改,如果改了,上面的分配方式就会改变.

NNBWOLF 2004-11-26

打赏
举报

关于你的问题,针对intel x86简单谈谈:
1 每次分配内存应该是从4的整数倍地址开始分配,无论是对结构变量还是简单类型的变量;
2 对于结构内的int,short等变量必须从偶地址开始分配;
3 对于结构变量,首先会得到其占用内存最大的成员变量具体占用的空间,然后在结构变量内按照这个量为其他变量分配空间;
4 你的第一个结构变量分配的内存空间应该是:
struct
{
char a;BYTE1
BYTE2空字节
short b;BYTE3
BYTE4
int c;BYTE5
BYTE6
BYTE7
BYTE8
}
第二个
struct
{
char a;BYTE1
BYTE2
BYTE3
BYTE4
int b;BYTE5
BYTE6
BYTE7
BYTE8
short c;BYTE9
BYTE10
..
BYTE12
}

我们的讨论从一道经典的题目开始： Intel和微软同时出现的面试题 #pragma pack(8) struct s1{ char a; long b; }; struct s2{ char c; s1 d; long long e; }; #pragma

方法1： #pragma pack(n) 使用伪指令#pragma pack (n)，编译器将按照n 个字节对齐；使用伪指令#pragma pack ()，取消自定义字节对齐方式。如果#pragma pack (n)中指定的n 大于结构体中最大成员的size，则其不起作用，结构体仍然按照size 最大的成员进行对界特别注意：该方法是在 gcc

在通讯程序中经常要涉及到传送struct.而struct中经常要涉及到字节对齐问题．为保证通讯两端数据读取的一致，两端必须定义相同的字节对齐．一般通讯中涉及到struct按1字节对齐．第二，涉及到不足四个字节，尽量把它补足四个字节．这样就不会出现问题了．#pragam pack(1)struct{ DWORD dwId; short

往arm平台移植应用程序时候遇到的一个关于字节对齐问题例子：定义一个类如下：class Example {public: Example();private: unsigned short c;} ;由于unsigned short 是两个字节，所以在PC上该类只占2个字节，而在arm平台上，由于4字节对齐问题，所以该类就变成4字节了，所以在arm当该类指针＋＋时，就会出现问题。：

文章最后本人做了一幅图，一看就明白了，这个问题网上讲的不少，但是都没有把问题说透。　　一、概念　　　　对齐跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍，他就被称做自然对齐。比如在32位cpu下，假设一个整型变量的地址为0x00000004，那它就是自然对齐的。　　　　二、为什么要字节对齐 　　　　需要字节对齐的根本原因在于CPU访问数