struct 内存对齐

C/C++ 中 struct 的内存对齐

struct 内存对齐
Photo by Brett Jordan / Unsplash

struct 的内存结构

在学习 Objective-C Blocks 的时候,有这样一段代码:

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {

        printf("Block\n");
    }

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

我对类似 (__block_impl *)blk 这样的类型转换很是不解,为啥能把一个 __main_block_impl_0 类型转成 __block_impl 类型呢?后来深入研究后才想起来,这原来是利用的 struct 的内存结构和内存对齐。

struct 是一种简单的数据结构,能够把各种不同类型的数据聚合在一起。

在 C/C++ 中,struct 的数据结构具有内存连续性的特点。这意味着 struct 中所有的成员在内存中存储的位置是连续的。但连续并不代表它们是紧挨着的。例如下面这个 struct,打印一下各个成员的内存地址:

struct S {
    short s;
    int i;
    double d;
};

int main() {
    S s = {};
    cout << &s << endl;
    cout << &s.s << endl;
    cout << &s.i << endl;
    cout << &s.d << endl;
    cout << sizeof(s) << endl;
}

// output:
// 0x16f9771c0
// 0x16f9771c0
// 0x16f9771c4
// 0x16f9771c8
// 16

struct 的起始地址和其第一个成员的地址一致,都是 0x16f9771c0 。第二个成员 i 为 int 类型,需要占用 4 个字节,地址相对于 struct 起始地址偏移了 4 个字节。第三个成员 d 是 double 类型,需要占用 8 个字节,地址相对于 struct 起始地址偏移了 8 个字节。而 d 是 struct 最后一个成员,地址偏移量 8 个字节加上本身占用了 8 个字节,加一起正好等于 struct 占用的全部内存大小。

struct 各成员的内存地址偏移是有一定规律的,这个规律称为内存对齐

为什么需要内存对齐

内存对齐是为了提高内存的访问速度,减少 CPU 访问内存的次数。CPU 访问内存时并不是一个字节一个字节地访问,而是以字长(word size)为单位访问。例如 32 位 CPU 的字长是 4 个字节,其访问内存的单位也是四个字节。

以上面的 struct S 为例,如果不进行内存对齐,而是让成员之间首尾紧挨在一起的话,那么其内存结构是这样的:

总共占用 2 + 4 + 8 = 14 个字节。在已知 struct 起始地址,也就是上图中位置为 0 的地址的情况下,CPU 想要访问成员 i 的话需要跨两个字长,也就是需要两次访问。访问结束后将两次访问的数据拼在一起才能得到成员 i 的完整数据。

但如果进行内存对齐的话,结构体的内存结构是这样的:

其中黑色块是为了内存对齐而偏移的字节,其中不存储成员数据。这时候访问成员 i 的话,就只需要一次访问就能够获取成员 i 的全部数据了。

因此进行内存对齐能够有效减少内存访问次数,提高性能。但这也是个典型的空间换时间的场景,因为中间有很多填充字节并没有存储真实数据。

内存对齐的规则

如果一个变量的内存地址正好位于它长度的整数倍,就被称作自然对齐

struct 内存对齐原则:

  • struct 的起始地址要能被其成员中最宽(占用字节数最多)的基本数据类型整除;
  • struct 的大小(size)也要能被其成员中最宽的基本类型整除;
  • struct 中每个成员的地址相对于 struct 起始地址的偏移必须是自然对齐的。

前面定义的 struct S 就符合这些规则。首先 short 类型的成员 s 的起始地址偏移量为 0,是第一个成员。第二个成员 i 是 int 类型,需要 4 个字节,因此自然对齐需要的偏移量是 4。最后一个成员 d 需要 8 个字节,偏移量为 8,恰好紧挨着成员 i 的尾巴,符合自然对齐。成员都自然对齐后,struct 所需总字节数为 16,能够被 8 整除。实例 s 的内存起始地址为 0x16f9771c0,转成十进制就是 6167163328,也能被 8 整除。

利用偏移量访问成员变量

struct Person
{
    int citizenship;
    int age;
};

int main() {
    int *age;
    int *city;
    auto temp = Person { 10, 11};
    auto person = &temp;
    city = (int *)person;
    size_t offset = offsetof(Person, age);
    age = (int *)((unsigned long)city + (unsigned long)offset);
//    age = city + offset / sizeof(int);
    cout << *city << endl;
    cout << *age << endl;
    cout << sizeof(Person) << endl;
    return 0;
}

// output:
// 10
// 11
// 8

上面代码中分别利用了 citizenship 和 age 的偏移量间接通过地址访问了 Person 的成员变量。

💡
注意指针的算数运算。pointer++ 并不代表将地址 pointer 加 1 个字节,而是加 sizeof(int) * 1 个字节。计算的时候可以将十六进制的地址转成 unsigned long 或者加偏移量的同时除以 sizeof(int)

Read more

碎碎念——投资,不确定性沟通定语

碎碎念——投资,不确定性沟通定语

投资理财 最近因为关税的冲击,美股正在经历一波大跌行情。我个人比较看好纳斯达克,也在一直定投纳斯达克。我是长期主义者,没有精力和时间在短期波动中挣钱,只想在下跌调整中「进货」。 定投分左侧定投和右侧定投。左侧定投是在下跌的过程中定投,而右侧定投是在上涨的过程中定投。左侧定投无法确认底部在哪里,需要源源不断往里投入金钱(行内成为「子弹」);右侧定投无法确认反弹是诱多还是形势已经逆转。我采用的是左侧定投,大跌大加,小跌小加,反弹时停止定投。不论采用哪种定投,殊途同归,都是尽量降低投资成本。 目前网上看衰美股的声音不少,不少人因为恐慌割肉卖出股票。但我们要知道目前美国仍旧是世界第一大国,消费潜力巨大,大型科技公司(苹果、英伟达等)的基本面并没有出现大问题。只是因为特朗普的「量子态」关税政策,导致市场恐慌抛售。我们无需担心纳斯达克、标普指数从此一蹶不振。恰恰相反,现在是买入美股的绝佳时机。苹果、英伟达等大型公司的 PE 值已经降到了合理位置,只要不买妖股,不投机,只关注纳斯达克、标普指数,只买大型公司股票,迟早会取得丰厚盈利的。

By Gray
怀念小时候吃过的食物

怀念小时候吃过的食物

前两天下班骑车回家的路上听到了路旁有人在讨论泡馍。他们口中的泡馍应该是类似西安羊肉泡馍之类的食物。但是我却想起来了小时候吃的不一样的泡馍以及其他吃食。 不一样的泡馍 小时候我们那里普遍比较贫穷,家家户户除了过年过节基本上很难吃到大块肉。小孩子饭量时小时大,中午吃的饭,半晌就又饿了。家里有大葱或者豆糁的话,可以拿着一个馍就着就吃了。整根的葱是最下馍的,葱白部分甜又辣,葱叶里面会有像鼻涕一样的粘液,要把它挤出来才下得嘴吃。豆糁是黄豆的发酵产物,煮熟的大豆加盐发酵几天,黏丝丝的时候团成球,放到发黑就能吃了。吃的时候从球上掰下来几小块就行。豆糁是咸的,因而也能下饭。不过最妙的吃法是将豆糁和鸡蛋一起炒。鸡蛋的香气和豆糁稍微发臭的味道混在一起,形成一种独特的香味。像北京的臭豆腐一样,闻着臭,吃着香。 如果家里没葱没豆糁了,馍又很干,那泡馍就是解决饿肚子的绝好办法。将干硬的馍掰成几瓣,不能太碎小,放到瓷碗里。倒入炒菜的肉味王佐料,或者是平时攒下来的方便面调料。再提溜着暖水瓶,倒进去冒着热气的水。当然香油是少不了的,拿着油光光的瓶子,滴进去几滴喷香的香油。最后用大碗盖住,或者干脆啥也不盖,静等

By Gray
Swift Server Push Notification 配置

Swift Server Push Notification 配置

获取证书 在 Apple Developer 开发者账号 Certificates, Identifiers & Profiles 里选择 Keys。新增一个 key, configure 里选择 Sandbox & Production。下载该 p8 证书,并且保存好(只能下载一次)。 终端 cd 到证书所在路径,输入下面指令。 openssl pkcs8 -nocrypt -in AuthKey_XXXXXXXXX.p8 -out ~/Downloads/key.pem cat key.pem 得到 PRIVATE KEY 字符串,复制好。 服务端配置 服务端有多种技术栈方案,包括 Java、

By Gray
香港游记——一个传统而又现代的城市

香港游记——一个传统而又现代的城市

这是 2024 年的最后一场旅行,从北京到香港,跨越了大半个中国。去香港,一方面是想领略一下它的文化和风光,另一方面是想办一个香港银行卡,买港美股以及海外收付款。 从北京到香港,动卧是一个不错的选择。乘坐 D903 次动车,晚上八点登车,睡一觉,第二天一早就到深圳北了。再从深圳北坐高铁过口岸到香港西九龙,差不多上午九点多就能到达香港。深圳北到西九龙的高铁车次非常多,不用担心买不到票。 密集的建筑 香港给我的初印象就是——这里的楼房真的很密集。不光是住宅区又高又密,商业区的建筑物与建筑物之间也几乎只有街道相隔,很少见到大型的公园或者绿化带。土地利用率很高。这一点和北京差别还是挺大的。北京虽然也是寸土寸金,但是市内绿化面积很高,大型公园也很常见。 街上密集的建筑,让人第一眼看就知道这是香港。 旧与新,传统与现代 在香港,不同地区的风格面貌会相差很多。你既能见到破旧不堪、需要修缮的古老楼房,也能见到银光闪闪、科技感十足的现代化大厦。这种新与旧的切换,传统和现代的反差,总是能给人强烈的震撼。这正是香港的魅力所在。 维多利亚港和中环摩天轮 维多利亚港是香港的中心,是香港旅游

By Gray