Rust: 从内存地址信息看内存布局
内存布局其实有几个:address(地址)、size(大小)、alignment(对齐位数,2 的自然数次幂,2,4,8…)。
今天主要从address来看内存的布局。
说明:下面以Struct,Enum以默认对齐的情况下(不包括C对齐即#[repr( C )]、 紧凑对齐 #[repr(packed)]、自定义对齐 #[repr(align(n))] 等情况)进行分析。
一、代码
#[derive(Default)]
struct BaseStruct {field1: u8,field2: u8,field3: i32,field4: u8,field5: u8,field6: u8,field7: u8,
}struct MyStruct{field1:u8,field2:BaseStruct,field3:MyEnum,field4:i64,
}
impl MyStruct{fn default() -> Self {MyStruct {field1: 1,field2: BaseStruct::default(),field3: MyEnum::Variant1(1),field4: 2,}}
}
// Enum的内存大小:最大字段大小的2倍,下面最大为i64:8个字节enum MyEnum {Variant1(i64),Variant2(i8),Variant3(i64),Variant4(i64),
}fn main() {println!("Size of u64 : {}", std::mem::size_of::<u64>());println!("Size of i64 : {}", std::mem::size_of::<i64>());println!("Size of MyEnum : {}", std::mem::size_of::<MyEnum>());println!("Align of MyEnum : {}", std::mem::align_of::<MyEnum>());println!("Size of BaseStruct : {}", std::mem::size_of::<BaseStruct>());println!("Align of BaseStruct : {}", std::mem::align_of::<BaseStruct>());println!("Size of MyStruct : {}", std::mem::size_of::<MyStruct>());println!("Align of MyStruct : {}", std::mem::align_of::<MyStruct>());println!("-------------BaseStruct-------------");let base_struct = BaseStruct::default();println!("address of base_struct : {}",get_ptr_address(&base_struct));println!("address of base_struct_field_1: {}",get_ptr_address(&base_struct.field1));println!("address of base_struct_field_2: {}",get_ptr_address(&base_struct.field2));println!("address of base_struct_field_3: {}",get_ptr_address(&base_struct.field3));println!("address of base_struct_field_4: {}",get_ptr_address(&base_struct.field4));println!("address of base_struct_field_5: {}",get_ptr_address(&base_struct.field5));println!("address of base_struct_field_6: {}",get_ptr_address(&base_struct.field6));println!("address of base_struct_field_7: {}",get_ptr_address(&base_struct.field7));println!("-------------MyStruct-------------");let my_struct = MyStruct::default();println!("address of my_struct : {}",get_ptr_address(&my_struct));println!("address of my_struct_field_1 : {}",get_ptr_address(&my_struct.field1));println!("address of my_struct_field_2 : {}",get_ptr_address(&my_struct.field2));println!("address of my_struct_field_3 : {}",get_ptr_address(&my_struct.field3));println!("address of my_struct_field_4 : {}",get_ptr_address(&my_struct.field4));println!("-----------get_ptr_address_2-----------");println!("address_2 of my_struct : {}",get_ptr_address_2(&my_struct));println!("address_2 of my_struct_field_1 : {}",get_ptr_address_2(&my_struct.field1));println!("address_2 of my_struct_field_2 : {}",get_ptr_address_2(&my_struct.field2));println!("address_2 of my_struct_field_3 : {}",get_ptr_address_2(&my_struct.field3));println!("address_2 of my_struct_field_4 : {}",get_ptr_address_2(&my_struct.field4));}fn get_ptr_address<T>(data: &T)->usize{data as *const _ as usize //会先创建一个引用
}
// 为什么不能用这个?
fn get_ptr_address_2<T>(data: &T)->usize{std::ptr::addr_of!(data) as usize //不需要创建一个引用
}
二、输出
Size of u64 : 8
Size of i64 : 8
Size of MyEnum : 16
Align of MyEnum : 8
Size of BaseStruct : 12
Align of BaseStruct : 4
Size of MyStruct : 40
Align of MyStruct : 8
-------------BaseStruct-------------
address of base_struct : 490357126640
address of base_struct_field_1: 490357126644
address of base_struct_field_2: 490357126645
address of base_struct_field_3: 490357126640
address of base_struct_field_4: 490357126646
address of base_struct_field_5: 490357126647
address of base_struct_field_6: 490357126648
address of base_struct_field_7: 490357126649
-------------MyStruct-------------
address of my_struct : 490357126600
address of my_struct_field_1 : 490357126636
address of my_struct_field_2 : 490357126624 // basestruct
address of my_struct_field_3 : 490357126600 // myenum
address of my_struct_field_4 : 490357126616
-----------get_ptr_address_2-----------
address_2 of my_struct : 490357126528
address_2 of my_struct_field_1 : 490357126528
address_2 of my_struct_field_2 : 490357126528
address_2 of my_struct_field_3 : 490357126528
address_2 of my_struct_field_4 : 490357126528
三、问题
可以对照一下address的顺序,来看一下各个field以及对应Struct、Enum的大小。
1、为什么BaseStruct的大小并不是field的起始地址到field的最后地址?
BaseStruct的真实size是12个字节。但起始address起始间隔目前只看到9。为什么?
从地址信息可以看出,
(1)field3(i32),重新布局后,已经放在前面,并不是从field1开始。地址是从490357126640->490357126644:占了4个字节。
(2)接下来是field1,field2,field4,field5,依次占了1个字节。
(3)再接下来是field6,field7,各占1个字节。
因为在进行内存布局优化时,已经按4+4+4的格局进行优化,这里面4就是BaseStruct alignment。
在最后4个字节中,field6,field7已经用掉了2个,还有2个空的(alignment padding)。因此是4+4+2+2=12。
其实:BaseStruct如果没有field7,或者说,再加一个field8(u8),其size均是12个字节!
这个在MyStruct中各field的地址信息,可以更真实显示BaseStruct(field2)的大小(即上下间隔)。即490357126624 ->490357126636(注:每次运行不一样)间隔为12。
当然,MyStruct也是一样,不能把field首地址和未地址相减得到其占用大小(计算得到36个字节,并不是40个字节!)。它的alignment是8。
因此需要注意的是:最后一个,是有alignment的。有些是只有部分占用。因此不能简单通过首地址和末地址相减来获得这个大小。
2、为什么add_of!在这儿不能用?
add_of宏生成了同样的地址。只需要进行下面的修改就可以了。
println!("address_2 of my_struct : {}",std::ptr::addr_of!(my_struct) as usize);
println!("address_2 of my_struct_field_1 : {}",std::ptr::addr_of!(my_struct.field1) as usize);
println!("address_2 of my_struct_field_2 : {}",std::ptr::addr_of!(my_struct.field2) as usize);
println!("address_2 of my_struct_field_3 : {}",std::ptr::addr_of!(my_struct.field3) as usize);
println!("address_2 of my_struct_field_4 : {}",std::ptr::addr_of!(my_struct.field4) as usize);
上面的修改和
fn get_ptr_address<T>(data: &T)->usize{data as *const _ as usize //会先创建一个引用
}
效果一样。