C语言复习第7章 自定义类型(结构体+位段+枚举+联合体)
目录
- 一、结构体
- 1.1 内置类型和自定义类型
- 1.2 结构体的概念
- 1.3 结构体基本的声明
- 1.4 区分两种创建结构体变量的方式
- 1.5 结构体变量的定义和初始化
- 1.6 区分一下typdef和变量列表
- 1.7 匿名结构体类型
- 1.8 访问结构体成员
- 1.9 修改字符数组成员变量的时候 要用strcpy
- 1.10 结构体的传参
- 1.11 结构体可以嵌套结构体
- 1.12 结构体的自引用(比如链表)
- 1.13 结构体也有值传递和址传递
- 二、结构体的内存对齐(如何计算结构体的大小?)
- 2.1 案例引入
- 2.2 对齐规则
- 2.3 计算偏移量的宏 offsetof(stddef.h)
- 例题1:char int char 12
- 例题2:char char int 8
- 例题3:double char int 16
- 例题4:结构体嵌套
- 例题5:成员变量是数组
- 2.4 为什么要内存对齐--空间换时间
- 2.5 #pragma修改默认对齐数
- 三、结构体实现位段
- 3.1 基本介绍
- 3.2 位段的内存如何分配
- 3.3 验证VS对位段的分配
- 3.4 位段跨平台问题
- 3.5 位段的应用:IP数据报
- 四、枚举
- 4.1 枚举类型的定义
- 4.2 枚举常量的值
- 4.3 枚举的优点
- 4.4 枚举类型的大小
- 五、联合体(共用体)
- 5.1 联合类型的定义
- 5.2 联合体的大小
- 5.3 判断大小端的新思路
- 5.4 匿名联合体的写法
一、结构体
1.1 内置类型和自定义类型
1.2 结构体的概念
- 结构是一些值的集合 这些值称为成员变量
- 结构的每个成员可以是不同类型的变量
1.3 结构体基本的声明
- 右边那部分仅仅是声明了一个结构体类型(类比int float…) 还没有创建变量
- 如果变量列表有对象的话 才是创建了 而且用变量列表直接创建的结构体变量 是全局变量
1.4 区分两种创建结构体变量的方式
s6也是全局变量
1.5 结构体变量的定义和初始化
可以直接在变量列表初始化
也可以乱序初始化:
不写f 默认是double
还有那个分号不要忘记了
1.6 区分一下typdef和变量列表
Stu是类型的别名
s1 s2才是全局变量
stu是结构体变量
Stu是结构体的别名 是一种自定义类型
有时候也会这么写
1.7 匿名结构体类型
声明完直接在变量列表创建变量
而且这个类型只能用这么一次
如果一个类型只想用一次 用完之后就不用了 就可以这么写
编译器会把上面的两个声明当成完全不同的两个类型 所以是非法的
只是看上去好像是同一个类型 但其实不是
这也体现了"只能用一次"的特点 每次都是个新的类型
1.8 访问结构体成员
- 对于结构体指针 可以用解引用再. 或者直接用->
- 结构体变量.成员名
- *(结构体指针).成员名
- 结构体指针->成员名
1.9 修改字符数组成员变量的时候 要用strcpy
b.name = “c++”; 肯定是错的(表达式必须是可修改的左值)
name是个数组名,是个地址(常量)
不能直接把一个"c++"直接给一个地址应该是把它放在地址所指向的空间里
*(b.name) = “c++”; 这种写法也是错的 他只能找到第一个字符 而并非整个字符数组
所以修改的时候需要用的strcpy函数
char *strcpy( char *strDestination, const char *strSource )
后地址指向的字符串拷贝到前面地址指向的空间
#include<stdio.h>
#include<string.h>
struct Book
{char name[20];float price;char id[10];
};
int main()
{struct Book b = { "C语言",55,"2021" };b.price = 60;strcpy(b.name, "c++");return 0;
}
1.10 结构体的传参
结构体有时候可能会比较大 所以还是建议结构体都传地址的
传址不仅可以访问所有结构体变量的成员 还可以改变结构体变量成员的值 已经足够了
尽量用传址的形式 因为传址 形参那就是一个地址 4/8字节而已
如果还是传值 那就会拷贝一份一模一样大的结构体变量 传参的压力比较大
1.11 结构体可以嵌套结构体
1.12 结构体的自引用(比如链表)
左边的设计绝对是错误的 无限套娃 结构体无限大?
右边用结构体指针才对
无限套娃 结构体无限大? No!
正确的自引用方式:
{ }里的成员列表 是结构体的一部分
结构体类型还没完善好 就重命名了? 肯定不行的
就相当于Node还没有的时候 就用Node了
这里面的先后顺序要搞清楚
1.13 结构体也有值传递和址传递
这只是改了形参的age 不会影响到实参
址传递 就可以更改 形参pStu指向的就是实参那个结构体对象
其实传址也算传值 只不过你的值是个地址
形参pStu其实也是实参pStu的一份拷贝 只不过地址的拷贝 导致他们都指向了同一个对象
二、结构体的内存对齐(如何计算结构体的大小?)
2.1 案例引入
为什么会这样呢?
结构体存在内存对齐的规则
2.2 对齐规则
- 结构体的第一个成员变量在与结构体变量偏移量为0的地址处
- 从第二个成员变量开始 成员变量要对齐到某个数字 (对齐数)的整数倍的地址处 再分配大小
- 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值
- VS中默认的对齐数值为8
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍
- 如果嵌套了结构体:
嵌套的结构体成员对齐到自己的最大对齐数的整数倍处
或者直接把该最大对齐数也作为当前嵌套结构体成员的对齐数
结构体的整体大小 仍是所有成员变量的最大对齐数(含嵌套结构体的对齐数)的整数倍
2.3 计算偏移量的宏 offsetof(stddef.h)
以2.4的例题为例
c1
的起始地址 相较于struct S1的起始位置的偏移量应该是0
i
的起始地址 相较于struct S1的起始位置的偏移量应该是4
c2
的起始地址 相较于struct S1的起始位置的偏移量应该是8
例题1:char int char 12
右边的数字就是 当前字节(当前内存单元) 相对于起始位置的偏移量
假设结构体变量s是从箭头指的地方(与结构体变量偏移量为0的地址处)开始分配空间 :
- S1:第一个成员变量 从0偏移量开始 是多大就分配多大 这里是1字节
- S2:第二个开始 要对齐到对齐数再开始分配 这里是4和8选4 要对齐到4的倍数 所以123被浪费 从4开始放1个int
- S3:第三个是char 1和8选1 要对齐到1的倍数 不会浪费空间 8放的就是c2
- S4:c1的对齐数是1 i的对齐数是4 c2的对齐数是1 最大对齐数是4
- S5:成员变量都放完了 结构体整个的大小还需要对齐到 所有成员的对齐数中 最大对齐数的倍数 最大对齐数是MAX{1,4,1}=4
- S6:放完三个成员变量 大小是9 不是4的倍数 所以结构体的大小取
12
又浪费三个字节
例题2:char char int 8
● c1从偏移量的位置开始放 而且占1字节(c1的对齐数也要算一下 是1 算总大小的时候可能要用到)
● c2放 就要考虑对齐数了 c2自己是1字节 < vs默认的8字节 -->对齐数取1 那么就要找一个"1倍数"偏移量的地方开始放c2 大小为1字节
● i放 对齐数取4 要找一个4的倍数–>从位置4开始放 大小为4字节
● 现在放完了 结构体的总大小应该要是所有对齐数里的最大对齐数(max1 1 4 = 4)的整数倍 发现当前大小是8字节 满足"4的倍数"要求 那总大小就是8
●注意:每个成员变量都对应一个对齐数
例题3:double char int 16
● d:对齐数8 起点0 放0 1 2 3 4 5 6 7
● c:对齐数1 起点8 放8
● i:对齐数4 起点12 放12 13 14 15
● 对齐数MAX=8 当前结构体大小为0-15=16 16满足8的倍数 总大小:16
● 虽然d的起点 肯定是0 用不到8 但是还是要算一下的 因为最后一步 要找对齐数MAX
例题4:结构体嵌套
● c1:对齐数是1 放0
● s3:s3的对齐数有{8 1 4} 8最大 8作为这个结构体的对齐数 所以s3的大小要对齐到8的倍数 再按照前面同样的规则 算出s3的大小是16 从他的对齐数8开始放 放8~23
● d:对齐数是8 放24~31
● 总体来说 一共占了0~31 32个内存单元->32字节
● 当前大小是32 所有对齐数有的最大值:MAX{1, MAX(1 4 8), 8} 最大是8 32是8的倍数 故32满足条件
● 注意: s3放的时候 起点是s3他自己的所有成员的最大对齐数的倍数 也可以理解成8就是s3的对齐数
例题5:成员变量是数组
● 把char c[5] 就看成5个char 规则一模一样的
● a 对齐数是4/8–>4 放0 1 2 3
● char 对齐数是1/8–>1 放4
● 有五个char 每个对齐数都是1 那就是 4 5 6 7 8
● d 对齐数是8/8–>8 那么9 10 11…15浪费 放16 17 …23
● 目前一共24 对齐数MAX = max{4,1,8} = 8 24满足8的倍数 就是24
2.4 为什么要内存对齐–空间换时间
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的 某些硬件平台只能在某些地址处取某些特定类型的数据 否则抛出硬件异常 - 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐
因为为了访问未对齐的内存 处理器需要作两次内存访问
而对齐的内存访问仅需要一次访问 - 总体来说:
结构体的内存对齐是拿空间来换取时间的做法
● 从某个对齐边界开始读 而且每次都读取4字节
● 如果对齐的话 读取i 只需要一次就可以
● 如果不对齐 要读取2次 再拼接得到i
既然如此
那么在设计结构体的时候
如果我们既要满足对齐 又要节省空间
就要让占用空间小的成员尽量集中在一起(尽量减少浪费) 如下图:
S1和S2类型的成员一模一样 但是S1占用12个字节 S2占用8字节
2.5 #pragma修改默认对齐数
结构在对齐方式不合适的时候 可以自己更改默认对齐数
#pragma这个预处理指令 可以改变默认对齐数
下图的结构体大小就是6了
默认对齐数改成1 相当于没有对齐了
三、结构体实现位段
3.1 基本介绍
● 使用和结构体一模一样 只不过 :后面指定了当前变量的比特位数
● 位段的位–>比特位位段的声明和结构是类似的,有两个不同:
- 位段的成员必须是 int、unsigned int 或signed int
- 位段的成员名后边有一个冒号和一个数字。
A就是一个位段类型 大小是8字节
3.2 位段的内存如何分配
- 位段的成员可以是 int, unsigned int, signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的
- 位段涉及很多不确定因素 位段是不跨平台的 注重可移植的程序应该避免使用位段
- 而且冒号:后面也有限制 最大不能超过前面数据类型 比如下面abcd最大32
最后c用完是个 剩下15个比特位
然后d要用 不够了 再开辟1个int 也就是32位 再给d用
之前剩下的15个比特位 d有没有用 C语言没有定论 取决于编译器的实现
3.3 验证VS对位段的分配
● 下面这个例子只能验证VS上的情况(不跨平台)
● 申请一个字节 从低位到高位使用(先用右边)
● 不够放 重新申请8比特位(1char) 然后之前没用的比特位的都抛弃
● 比如说a 10的二进制位是00001010 但是a只放得下三个 所以截断成010 从右往左放进去
● 然后b是4个比特位 还能继续放12 即1100
● c5位 放不下 开辟一个char 8bit位 前面没用完的丢弃 c放00011
● d又放不下 再开辟
● 所以一共3字节 而且内存的布局是62 03 04(16进制)
3.4 位段跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的
- :后的最大位的数目不能确定 16位机器最大16 32位机器最大32 写27在16位机器会出问题
- 位段中的成员在内存中从左向右分配 还是从右向左分配标准尚未定义
- 当一个结构包含两个位段成员 第二个位段成员比较大 无法容纳于第一个位段剩余的位时 是舍弃剩余的位还是利用 这是不确定的
- 跟结构相比 位段可以达到同样的效果 但是可以很好的节省空间 但是有跨平台的问题存在
3.5 位段的应用:IP数据报
把网络想象成一个高速公路 如果都是一个一个的大货车 很容易浪费空间造成拥堵
如果合理规划 一个一个都是小汽车 效率更高
四、枚举
4.1 枚举类型的定义
枚举顾名思义就是一一列举 把可能的取值一一列举
enum Sex是自定义的枚举类型
用该枚举类型创建的变量 可能的取值就是大括号里的内容
大括号里的内容不可以被修改 所以叫枚举常量
枚举常量的默认值是0 1 2 3 4 5 …
{ }里是在给枚举常量初始化(否则就是默认0 1 2)
下面的MALE=5企图修改枚举常量的值 err
C语言这么写 不会报错 把5赋给s s得到的其实本质还是FEMALE 但是这么写类型总归是不匹配的(整型赋给枚举类型) C++就会报错
给s赋值的时候 尽量就使用{}里可能的取值
enum Sex s = FEMALE
拿枚举常量给枚举变量s赋值
才不会出现类型的差异
4.2 枚举常量的值
4.3 枚举的优点
我们可以使用 #define 定义常量 为什么非要使用枚举?
枚举的优点:
1.增加代码的可读性和可维护性
2.和#define定义的标识符比 枚举有类型检查 更加严谨
枚举的FEMALE有自己的类型:即enum Sex#define 是不管任何情况 看到MAX就替换成100
3.防止了命名污染(封装)
4.便于调试
#define在调试的时候 就已经完成了替换了 不存在这些符号了
5.使用方便 一次可以定义多个常量
4.4 枚举类型的大小
枚举类型可能的取值 就是{}其中的一个
本质就是int 那么大小就是int 就是4字节了
五、联合体(共用体)
5.1 联合类型的定义
联合体的使用前提:每次只会使用其中一个成员
联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员
特征是这些成员公用同一块空间(所以联合也叫共用体)
至少c和i都共用了第一个内存单元
5.2 联合体的大小
联合的成员是共用同一块内存空间的 这样一个联合变量的大小
至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)
- 联合的大小至少是最大成员的大小
- 当最大成员大小 不是最大对齐数的整数倍的时候 就要对齐到最大对齐数的整数倍
如下图:
14不是最大对齐数4的倍数
故应该取16
同理 下图大的大小应该是8
最大的联合成员是5 c数组
所以联合体的大小 至少是5
但是5不是最大对齐数4的倍数 故取8
5.3 判断大小端的新思路
char 一定要写在int前面才对
这样才是共用第一个内存单元 才有区分度
分配4字节 把1赋给i(1是int 也就是4字节 8个16进制位)
要么内存变成00 00 00 01(大端)
要么内存变成01 00 00 00(小端)
这个时候c总归是指向低地址处的第一个内存单元
看看c放的是00 还是 01 就知道了
5.4 匿名联合体的写法
由于这个联合体只要用一次
所以可以写成匿名形式的