struct 内存对齐
C/C++ 中 struct 的内存对齐
struct 的内存结构
在学习 Objective-C Blocks 的时候,有这样一段代码:
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
printf("Block\n");
}
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
return 0;
}
我对类似 (__block_impl *)blk
这样的类型转换很是不解,为啥能把一个 __main_block_impl_0
类型转成 __block_impl
类型呢?后来深入研究后才想起来,这原来是利用的 struct 的内存结构和内存对齐。
struct 是一种简单的数据结构,能够把各种不同类型的数据聚合在一起。
在 C/C++ 中,struct 的数据结构具有内存连续性的特点。这意味着 struct 中所有的成员在内存中存储的位置是连续的。但连续并不代表它们是紧挨着的。例如下面这个 struct,打印一下各个成员的内存地址:
struct S {
short s;
int i;
double d;
};
int main() {
S s = {};
cout << &s << endl;
cout << &s.s << endl;
cout << &s.i << endl;
cout << &s.d << endl;
cout << sizeof(s) << endl;
}
// output:
// 0x16f9771c0
// 0x16f9771c0
// 0x16f9771c4
// 0x16f9771c8
// 16
struct 的起始地址和其第一个成员的地址一致,都是 0x16f9771c0
。第二个成员 i 为 int
类型,需要占用 4 个字节,地址相对于 struct 起始地址偏移了 4 个字节。第三个成员 d 是 double
类型,需要占用 8 个字节,地址相对于 struct 起始地址偏移了 8 个字节。而 d 是 struct 最后一个成员,地址偏移量 8 个字节加上本身占用了 8 个字节,加一起正好等于 struct 占用的全部内存大小。
struct 各成员的内存地址偏移是有一定规律的,这个规律称为内存对齐。
为什么需要内存对齐
内存对齐是为了提高内存的访问速度,减少 CPU 访问内存的次数。CPU 访问内存时并不是一个字节一个字节地访问,而是以字长(word size)为单位访问。例如 32 位 CPU 的字长是 4 个字节,其访问内存的单位也是四个字节。
以上面的 struct S
为例,如果不进行内存对齐,而是让成员之间首尾紧挨在一起的话,那么其内存结构是这样的:
总共占用 2 + 4 + 8 = 14 个字节。在已知 struct 起始地址,也就是上图中位置为 0 的地址的情况下,CPU 想要访问成员 i 的话需要跨两个字长,也就是需要两次访问。访问结束后将两次访问的数据拼在一起才能得到成员 i 的完整数据。
但如果进行内存对齐的话,结构体的内存结构是这样的:
其中黑色块是为了内存对齐而偏移的字节,其中不存储成员数据。这时候访问成员 i 的话,就只需要一次访问就能够获取成员 i 的全部数据了。
因此进行内存对齐能够有效减少内存访问次数,提高性能。但这也是个典型的空间换时间的场景,因为中间有很多填充字节并没有存储真实数据。
内存对齐的规则
如果一个变量的内存地址正好位于它长度的整数倍,就被称作自然对齐。
struct 内存对齐原则:
- struct 的起始地址要能被其成员中最宽(占用字节数最多)的基本数据类型整除;
- struct 的大小(size)也要能被其成员中最宽的基本类型整除;
- struct 中每个成员的地址相对于 struct 起始地址的偏移必须是自然对齐的。
前面定义的 struct S
就符合这些规则。首先 short 类型的成员 s 的起始地址偏移量为 0,是第一个成员。第二个成员 i 是 int 类型,需要 4 个字节,因此自然对齐需要的偏移量是 4。最后一个成员 d 需要 8 个字节,偏移量为 8,恰好紧挨着成员 i 的尾巴,符合自然对齐。成员都自然对齐后,struct 所需总字节数为 16,能够被 8 整除。实例 s 的内存起始地址为 0x16f9771c0,转成十进制就是 6167163328,也能被 8 整除。
利用偏移量访问成员变量
struct Person
{
int citizenship;
int age;
};
int main() {
int *age;
int *city;
auto temp = Person { 10, 11};
auto person = &temp;
city = (int *)person;
size_t offset = offsetof(Person, age);
age = (int *)((unsigned long)city + (unsigned long)offset);
// age = city + offset / sizeof(int);
cout << *city << endl;
cout << *age << endl;
cout << sizeof(Person) << endl;
return 0;
}
// output:
// 10
// 11
// 8
上面代码中分别利用了 citizenship 和 age 的偏移量间接通过地址访问了 Person 的成员变量。
pointer++
并不代表将地址 pointer 加 1 个字节,而是加 sizeof(int) * 1
个字节。计算的时候可以将十六进制的地址转成 unsigned long
或者加偏移量的同时除以 sizeof(int)
。