自定义类型
前言:不知不觉又过了一个礼拜。时间过的还真是快呀。好了废话不多说,今天我们来学习C语言中的结构体,联合体,枚举。
我们都知道C语言中数据类型大致被分为基本类型,自定义类型,指针类型,空类型
。以下面的一张图来进行理解。
今天我们就是专门来学习C语言中的自定义类型。
1 结构体
1.1结构体类型的声明
struct tag
{member_list;
}variable_list;
1.2 结构体变量的创建和初始化
#include<stdio.h>
struct student
{char name[20];//名字int age;//年龄char sex[10];//性别double weight;//体重
};
int main()
{//按照结构体的顺序初始化struct student s1 = { "zhangsan",18,"nan",50 };printf("%s,%d,%s,%lf\n", s1.name, s1.age, s1.sex, s1.weight);//指定顺序初始化struct student s2 = { .age = 20,.weight = 55,.name = "lisi",.sex = "nan" };printf("%s,%d,%s,%lf\n", s2.name, s2.age, s2.sex, s2.weight);return 0;
}
1.3 结构体的特殊声明
struct
{member_list;
};
这是一种匿名结构体。需要注意的是:这种匿名结构体如果不进行类型重命名的话,基本上只能使用一次
。
一起来看看下面这段代码是否合法呢?
#include<stdio.h>
struct
{int age;char name[20];
}s1;struct
{int age;char name[20];
}*p;
int main()
{//编译器把上面的两个声明当成是两个不同的类型,所以是非法的p = &s1;//ok?//s2没有进行声明struct s2 = { 20,"lisi" };//ok?return 0;
}
1.4 结构体的自引用
struct Node
{int data;//是否可行呢?struct Node next;
};
答案自然是不行的。结构体中再包含一个同类型的结构体变量,这样结构体的大小是无穷大的。是不合理的。
正确的结构体自引用
struct Node
{int data;struct Node* next;
};
使用了typedef对匿名结构体重命名
之后,也容易引发问题。
typedef struct Node
{int data;Node* next;
}Node;
这也是不可以的。Node是对匿名结构体重命名之后产生的。但是在匿名结构体内部提前使用Node类型创建成员变量是不可以的
。
1.5 结构体内存对齐
想计算结构体的大小,就必须了解结构体内存对齐规则。
内存对齐的规则:
结构体第一个成员对齐到结构体变量起始位置偏移量为0的地址处
。
2.其它成员变量对齐到某个数字(对齐数)的整数倍的地址处
。
对齐数=编译器默认的对齐数与该成员变量大小的较小值
。
VS中默认对齐数是8
Linux中gcc没有默认对齐数,对齐数就是该成员变量自身的大小
3.结构体总大小就是最大对齐数(结构体中每一个成员变量都有一个对齐数,所有对齐数中最大的)的整数倍
。
4.嵌套结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处。结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍
。
#include<stdio.h>
struct S1
{//char占1个字节,Vs默认对齐数是8,较小值作为对齐数// 从偏移量为0处的地址开始计算char ch;//1 8 1// 1char c;//1 8 1//4是对齐数,要对齐到4的倍数的地址处,因此浪费掉2个字节// 4~7int data;//4 8 4
};
struct S2
{//0char c;//1 8 1//4~7int data;//4 8 4//8char ch;//1 8 1
};
int main()
{printf("%zd\n", sizeof(struct S1));//8printf("%zd\n", sizeof(struct S2));//12return 0;
}
嵌套结构体
#include<stdio.h>
struct S4
{//0char ch;//1 8 1//8~15double d;//8 8 8
};
struct S3
{//0char ch;//1 8 1//1char c;//1 8 1//结构体S4中最大对齐数是8,Vs默认对齐数也是8,8是对齐数//s4占16个字节,浪费掉6个字节,从偏移量为8的地址处开始计算//8~23struct S4 s4;//8 8 8//24~27int data;//4 8 4
};
int main()
{//0~27一共28个字节,不是最大对齐数8的倍数,因此再浪费掉4个字节//结构体S3的大小就是32个字节printf("%zd\n", sizeof(struct S3));//32printf("%zd\n", sizeof(struct S4));//16return 0;
}
为什么存在内存对齐呢?
1.平台原因:
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
。
- 性能原因:
数据结构(尤其是栈)应该尽可能的在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问,而对齐的内存访问仅需要作一次内存访问
。
总体来说,结构体内存对齐是用空间换取时间的做法
。
1.6 修改默认对齐数
#include<stdio.h>
//修改默认对齐数为4
#pragma pack(4)
struct S
{//0~3int data;//4 4 4//4~11double a;//8 4 4
};
//还原默认对齐数
#pragma pack()
int main()
{printf("%zd\n", sizeof(struct S));//12return 0;
}
1.7 结构体传参
#include<stdio.h>
struct S
{int data[1000];int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{printf("%d\n", ps->num);
}
int main()
{print1(s); //传结构体print2(&s); //传地址return 0;
}
哪一种传参方式更好呢?首选print2函数。
原因是:函数在传参的时候,参数需要进行压栈,在时间和空间上都会有系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,会导致性能的下降
。
结论:结构体传参的时候传结构体的地址
。
2 位段
说完结构体我们就该说说什么是位段了。位段与结构体是非常类似的,有两个不同。
2.1 位段
1.位段的成员必须是int,unsigned int,signed int,char等类型。在C99中位段成员的类型还可以是其它类型的
。
2.位段成员后面有一个冒号和一个数字
。
#include<stdio.h>
struct S
{//数字代表该数据占bit位的个数char a : 3;char b : 4;char c : 5;char d : 4;
};
int main()
{printf("%zd\n", sizeof(struct S));
}
这个位段的大小是多少呢?在研究这个问题之前,我们先来了解一下位段的内存分配。
2.2 位段的内存分配
位段的内存分配:
1.位段的成员可以是int,unsigned int,signed int,或者是char等类型
。
2.位段的空间上是按照4个字节(int)或者1个字节(char)进行开辟的
。
3.位段涉及很多不确定的因素,位段是不跨平台的。注重可移植的程序应该避免使用位段
。
用一幅图来解释一下上面的代码。
Vs中当剩余位不够下一个位段成员使用时,空间会被浪费掉。
2.3 位段的跨平台问题
-
int 位段被当成是有符号数还是无符号数是不确定的
。 -
位段中最大位的数目是不确定的(16位机器最大16,32位机器最大32,写成27 ,在16位机器会出问题)
。 -
位段中的成员从左向右分配还是从右向左分配是未定义的
。 -
当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的
。
总结:位段也可以达到节省空间的效果,但是有跨平台的问题存在。
2.4 位段的使用注意事项
位段的几个成员共用同一个字节,这样有些位段成员的起始地址就不是某个字节的起始地址。那么这些位置处是没有地址的
。内存中给每一个字节分配了地址,一个字节内部的bit位是没有地址的。所以不能对位段的成员使用&操作符,这样就不能使用scanf直接对位段的成员输入值,只能是先输入放在变量中,然后赋值给位段成员。
3 联合体
联合体这个名字呢小编认为并不够直观,联合体又称共用体。与结构体类似,可以存放一个或者多个成员,这些成员可以是不同的类型。
但是编译器只为最大的成员分配足够的内存空间
,联合体的特点是所有成员共用同一块内存空间
。
给联合体一个成员赋值,其他成员的值也会跟着变化。
#include<stdio.h>
//联合体的声明
union Un
{char c;int i;
};
int main()
{//联合体变量的定义union Un u = { 0 };printf("%p\n", &u);printf("%p\n", &(u.c));printf("%p\n", &(u.i));return 0;
}
看看这段代码,输出的结果是否一致呢?答案当然是肯定的了。
可以看到,联合体是共用同一块内存空间的,因此地址也是一样的。
我们都知道不同的数据类型大小也是不相同的。结构体也有自己的大小。那么联合体的大小如何计算呢?
3.1 联合体的特点
1.联合体的大小至少是最大成员的大小
。
2.联合体的大小是最大对齐数的整数倍
。
#include <stdio.h>
union Un1
{//char类型的数组,每一个元素的大小是1个字节,数组大小是5个字节//Vs中默认对齐数是8,数组每一个元素大小是1个字节,较小值作为对齐数char c[5];//5 1 8 1//int占4个字节,4<8,4作为对齐数int i;//4 4 8 4
};
union Un2
{//short占2个字节,2<8,2作为对齐数short c[7];//14 2 8 2//int占4个字节,4<8,4作为对齐数int i;//4 4 8 4
};
int main()
{//下⾯输出的结果是什么?//5不是4的倍数,因此浪费3个字节,联合体Un1的大小是8个字节printf("%zd\n", sizeof(union Un1));//8//14不是4的倍数,因此浪费2个字节,联合体Un2的大小是16个字节printf("%zd\n", sizeof(union Un2));//16return 0;
}
注:联合体也是可以节省空间的
。
小练习:使用联合体判断当前机器的大小端。
#include<stdio.h>
int check_sys()
{union Un{char c;int i;}un;un.i = 1;//返回1是小端,返回0是大端return un.i;
}
int main()
{int ret = check_sys();if (1 == ret){printf("小端\n");}else{printf("大端\n");}return 0;
}
4 枚举
枚举顾名思义就是 一 一 列举,把可能的取值列举出来。比如一个礼拜有7天,性别等都可以使用枚举的方式列举。
4.1 枚举的特点
//枚举类型
enum Day
{//枚举常量Mon,Tues,Wed,Thur,Fri,Sat,Sun
};
枚举常量是有取值的,默认从0开始,然后依次递增1
。在进行枚举类型声明的同时也可以对枚举常量赋初值,然后依次递增1
。
4.2 枚举的优点
1.增加了代码的可读性和可维护性
。
2.相比较于#define定义的标识符枚举有类型的检查 ,更加严谨
。
3.枚举可以一次性定义多个常量
。
4.枚举常量遵循作用域规则,在函数内声明,只能在函数内使用
。
5.便于调试,在预处理阶段会删除#define定义的符号
。
总结:今天的分享到此结束,感谢各位五湖四海的朋友为小编点点赞吧。