struct 内存对齐

C/C++ 中 struct 的内存对齐

struct 内存对齐
Photo by Brett Jordan / Unsplash

struct 的内存结构

在学习 Objective-C Blocks 的时候,有这样一段代码:

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {

        printf("Block\n");
    }

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

我对类似 (__block_impl *)blk 这样的类型转换很是不解,为啥能把一个 __main_block_impl_0 类型转成 __block_impl 类型呢?后来深入研究后才想起来,这原来是利用的 struct 的内存结构和内存对齐。

struct 是一种简单的数据结构,能够把各种不同类型的数据聚合在一起。

在 C/C++ 中,struct 的数据结构具有内存连续性的特点。这意味着 struct 中所有的成员在内存中存储的位置是连续的。但连续并不代表它们是紧挨着的。例如下面这个 struct,打印一下各个成员的内存地址:

struct S {
    short s;
    int i;
    double d;
};

int main() {
    S s = {};
    cout << &s << endl;
    cout << &s.s << endl;
    cout << &s.i << endl;
    cout << &s.d << endl;
    cout << sizeof(s) << endl;
}

// output:
// 0x16f9771c0
// 0x16f9771c0
// 0x16f9771c4
// 0x16f9771c8
// 16

struct 的起始地址和其第一个成员的地址一致,都是 0x16f9771c0 。第二个成员 i 为 int 类型,需要占用 4 个字节,地址相对于 struct 起始地址偏移了 4 个字节。第三个成员 d 是 double 类型,需要占用 8 个字节,地址相对于 struct 起始地址偏移了 8 个字节。而 d 是 struct 最后一个成员,地址偏移量 8 个字节加上本身占用了 8 个字节,加一起正好等于 struct 占用的全部内存大小。

struct 各成员的内存地址偏移是有一定规律的,这个规律称为内存对齐

为什么需要内存对齐

内存对齐是为了提高内存的访问速度,减少 CPU 访问内存的次数。CPU 访问内存时并不是一个字节一个字节地访问,而是以字长(word size)为单位访问。例如 32 位 CPU 的字长是 4 个字节,其访问内存的单位也是四个字节。

以上面的 struct S 为例,如果不进行内存对齐,而是让成员之间首尾紧挨在一起的话,那么其内存结构是这样的:

总共占用 2 + 4 + 8 = 14 个字节。在已知 struct 起始地址,也就是上图中位置为 0 的地址的情况下,CPU 想要访问成员 i 的话需要跨两个字长,也就是需要两次访问。访问结束后将两次访问的数据拼在一起才能得到成员 i 的完整数据。

但如果进行内存对齐的话,结构体的内存结构是这样的:

其中黑色块是为了内存对齐而偏移的字节,其中不存储成员数据。这时候访问成员 i 的话,就只需要一次访问就能够获取成员 i 的全部数据了。

因此进行内存对齐能够有效减少内存访问次数,提高性能。但这也是个典型的空间换时间的场景,因为中间有很多填充字节并没有存储真实数据。

内存对齐的规则

如果一个变量的内存地址正好位于它长度的整数倍,就被称作自然对齐

struct 内存对齐原则:

  • struct 的起始地址要能被其成员中最宽(占用字节数最多)的基本数据类型整除;
  • struct 的大小(size)也要能被其成员中最宽的基本类型整除;
  • struct 中每个成员的地址相对于 struct 起始地址的偏移必须是自然对齐的。

前面定义的 struct S 就符合这些规则。首先 short 类型的成员 s 的起始地址偏移量为 0,是第一个成员。第二个成员 i 是 int 类型,需要 4 个字节,因此自然对齐需要的偏移量是 4。最后一个成员 d 需要 8 个字节,偏移量为 8,恰好紧挨着成员 i 的尾巴,符合自然对齐。成员都自然对齐后,struct 所需总字节数为 16,能够被 8 整除。实例 s 的内存起始地址为 0x16f9771c0,转成十进制就是 6167163328,也能被 8 整除。

利用偏移量访问成员变量

struct Person
{
    int citizenship;
    int age;
};

int main() {
    int *age;
    int *city;
    auto temp = Person { 10, 11};
    auto person = &temp;
    city = (int *)person;
    size_t offset = offsetof(Person, age);
    age = (int *)((unsigned long)city + (unsigned long)offset);
//    age = city + offset / sizeof(int);
    cout << *city << endl;
    cout << *age << endl;
    cout << sizeof(Person) << endl;
    return 0;
}

// output:
// 10
// 11
// 8

上面代码中分别利用了 citizenship 和 age 的偏移量间接通过地址访问了 Person 的成员变量。

💡
注意指针的算数运算。pointer++ 并不代表将地址 pointer 加 1 个字节,而是加 sizeof(int) * 1 个字节。计算的时候可以将十六进制的地址转成 unsigned long 或者加偏移量的同时除以 sizeof(int)

Read more

2025 年度总结

2025 年度总结

今天是 2026 年 1 月 1 号,又是新的一年。这个元旦没有安排出行任务,就在家里休息休息,或者出门溜达溜达。昨天休了一天全薪病假,做了体检,写了年终绩效总结,晚上干了一顿烤肉,没有时间写个人的年度总结。今天起早写写总结。 以下「今年」指 2025 年。 职业发展 算起来,我已经毕业工作四年多了。职业发展整体上还算稳定,没有碰到过糟心事,遇到的领导们也都对我关怀有加。今年又晋升一次,薪资迈上新的台阶。越往上升,越觉得离职业生涯的终点越近,逼迫自己赶紧找个靠谱稳定的副业,到 35 岁没人要的时候能养活自己。 最近两年 AI 大模型的崛起,提高了许多行业的可替代性。码农虽然不是首当其冲的,但危机感已经弥漫在各个论坛博客公共平台上面。没有人能准确预测到未来发展,但做好两手准备是很有必要的。码农不能再只低着头守着自己的键盘和屏幕,也要往外看,接触社会上的各种信息,打破信息壁垒。掌握的信息越多,出路就越多。

By Gray
联通 FTTR 宽带从路由器设置自动重启和穿墙功率

联通 FTTR 宽带从路由器设置自动重启和穿墙功率

几个月前把家里宽带换成了联通的千兆 FTTR 宽带,包含一主一从两个点位。配套光猫设备是华为的星光 F50 尊享版。 主点位放置在客厅茶几上,方便连接电视。从点位放在卧室门口,那里恰好有一个不耽误过路的小拐角可以放路由器。平常我们基本不在客厅活动,其他区域最近的 Wi-Fi 信号源是从路由器,因此我们大多数的设备连接的都是从路由器。从路由器的工作负荷很大。 从路由器个头小主路由器很多,散热不咋地。工作时间久了发热就容易发生数据包堵塞,丢包延迟高。需要把它电源拔掉重启。从宽带开通到现在,数据包堵塞影响网络的情况每个月会发生一次。有一次还影响了居家办公的视频会议。宽带维修师傅也给不出有效的法子,建议就是定期插拔从路由器电源。 从路由器和书房之间隔了两堵墙。信号到我书桌那个位置时,千兆网速已经衰减到只有 400-500Mbps 了,折损将近一半。叠加路由器发热的 debuff,书桌位置的网速最差的时候几乎和百兆宽带差不多。 我尝试过在光猫后台管理将路由器功率设置到「穿墙」模式,但没有任何作用。今天在后台研究了一番发现,原来我之前设置的功率是仅对主路由器生效,从路由器还是标准功率。要修

By Gray