数据对齐问题

技术2022-05-11 241

发信人: law (游戏*人生), 信区: C 标题: Re: 发句牢骚发信站: 饮水思源 (Fri May 24 15:59:56 2002) , 转信不对齐的数据存取在x86上是影响速度，到了sparc或者MIPS上就是个bus error。对齐原则一般是对应指令操作数据的长度。例如*(int *)p = 1; 在MIPS上一般会被编译成sw(store word)指令 p要按照sizeof (int)对齐。 *(char *)p = 1. 对应sb指令，就不需要对齐了。

发信人: jackzhang (编程浪子), 信区: C 标题: 对齐问题的小结和疑问发信站: 饮水思源 (2002年05月24日21:15:32 星期五), 站内信件假设所有的数据类型的长度都是2的n次方 (char[5] == 5个char) 假设编译器采用这种对齐策略: "上一个"字段的地址(初始=0) offset "当前字段" count "当前"字段的类型 type(count) "上一个"字段和"当前"字段之间填充长度 fillsize 假如满足 ( offset + sizeof(type(count-1)) + fillsize) mod sizeof(type(count)) == 0 则认为是对齐的,前提当然是整个struct的基地址是"0" 如果不满足,那就在第(count)和第(count+1)字段之间填充这些都是由编译器在编译的时候做的,但是不能保证在运行的时候各个字段也是对齐的,关键在于struct的实际基地址例如 struct A { WORD a1; DWORD a2; }; 如果&a == 2,那么a.a2就没有对齐,那么对于运行时的分配策略来说, 只要struct的基地址能被struct中最大字段的长度(2的n次方)整除, 那么在运行时也是每个字段也是对齐的. 精确的说法是所有字段长度的最小公倍数整除,因为假设所有字段的长度都是2的n次方,但是有个问题这里:struct本身也可以看成单一字段,例如: struct foo { WORD a1; WORD a2; WORD a3; }; struct foo2 { foo f1; WDORD d; }; 就可以看成长度是6的字段证明:用数学归纳法, 编译时的对齐等式中的offset换成base+offset,而由于base能被最大的2的n次方整除,所以编译时的等式仍然成立. 对于win32的内存分配VirtualAlloc来说它的基地址必然是64K的整数倍,那理论上用VirtualAlloc分配的struct运行时是对齐的. 因为可以认为没有比64K更大的字段类型了. 对于new(malloc)来说,它相当于管理VirtualAlloc分配的内存进行内部再分配,当然分配算法不可能去找stuct中的最大的字段长度,那对于32位计算机来说,struct基地址至少能被4整除, 猜想: 标志堆的使用情况的内部数据是32位的,例如某个内存块的使用用下列结构描述 struct { DWORD len; char buf[1]; }; 所以导致buf(也就是new返回的地址)落在32位边界上. 当然c/c++的heap的管理肯定复杂的多. 总之在运行的时候不一定能保证全部对齐,因为一方面不是所有的字段长度都是1,2,4,还有其他的例如6,除非base能被所有字段的最小公倍数整除. 回家的路上想起为什么会没有对齐了,因为我的struct中有变长字段,然后一块内存含有n个struct,这样这块内存中"下一个"struct 可能会没有对齐. struct STRING { short len; char buf[1]; }; 解决的办法可以用law说的ReadWord()来做,但是效率低,一开始我想到变为 struct STRING { short len; char * buf; }; 然后把变长的内容放到"所有"的struct的后面,但是一方面在生成内存存储的时候有一点繁琐(需要最后空闲位置指针),而且更关键的是并没有解决对齐问题,换句话说,如果一个struct完全是由WORD和DWORD组成,也不能保证"下一个"struct是对齐的, 例如 struct A { WORD a; }; struct B { DWORD b; }; 如果内存中连续有A和B,那b.b不一定对齐.

因此我的解决办法是规定struct必须全部由WORD组成(当然也可以全部由DWORD组成) struct STRING { short len; short xxx; //... char buf[1]; }; 对于buf的实际长度必须是2的整数倍 len = strlen(str) + strlen(str) mod 2; STRING * s = (STRING*)malloc(sizeof(STRING) + len - 1); memcpy(s->buf, str, len);

发信人: law (游戏*人生), 信区: C 标题: Re: 对齐问题的小结和疑问发信站: 饮水思源 (2002年05月24日23:36:12 星期五), 站内信件 glibc的malloc策略大致是2*sizeof(size_t)对齐的，这是因为它的内存头定义为这么大。当你需要更大的对齐字节数的时候，可以用memalign来分配，它的策略是分配一块内存然后取对齐部分，并回收以前的零头。一般的C库分配的内存至少是按sizeof(int)对齐的。但对齐有时候会比较浪费，因为内碎片。所以我曾经针对特定应用，设计过更复杂的分配策略。就是对于不需要对齐操作的小内存块用小内存头组织成 hash表来分配，并放在单独的堆里，一般的操作还是2*sizeof(size_t)对齐，更大的对齐操作用glibc的策略。这其实是一种用时间换空间的策略。当你的应用有大量零碎内存块的时候可以节省内存。但因为内存头比较小，所以涉及一些位操作，可能会慢一点。

实际上编译器的对齐策略基本是一致的在程序里找到不对齐的操作并不是一件难事，因为有core dump。

专利

最新回复(0)