结构体

什么是结构体?

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。
结构体类型的声明：

struct Stu
{
    
    
 char name[20];//名字
 int age;//年龄
 char sex[5];//性别
 char id[20];//学号
}；//分号不能丢

这个struct Stu就是你创建的一个类型，里面的所有成员变量都可以是不同类型。

特殊声明：

匿名结构体类型

//匿名结构体类型
struct
{
    
    
 int a;
 char b;
 float c;
}x;
struct
{
    
    
 int a;
 char b;
 float c;
}a[20], *p;

//在上面代码的基础上，下面的代码合法吗？
p = &x;

结果：不合法，记住，即使两个结构体内容相同，它们仍然是两种类型的结构体。

结构的自引用

结构体内包含一个成员为结构体本身。
正确的做法

struct Node
{
    
    
 int data;
 struct Node* next;//如果没有*号，就是错误的，
};

在这里插入图片描述
类型先定义，后使用!

结构体的定义和初始化：

struct Point
{
    
    
 int x;
 int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
struct Point p3 = {
    
    x, y};//初始化：定义变量的同时赋初值。

struct Stu        //类型声明
{
    
    
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {
    
    "zhangsan", 20};//初始化

struct Node
{
    
    
 int data;
 struct Point p;
 struct Node* next;
}n1 = {
    
    10, {
    
    4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {
    
    20, {
    
    5, 6}, NULL};//结构体嵌套初始化

结构体内存对齐

这是重点内容！！！
如何计算结构体的大小？这就涉及到结构体的内存方式了。
在这里插入图片描述
都是两个char类型，一个int类型，为什么会有不同内存的大小呢？
因为内存对齐。
首先来讲为什么会有内存对齐？

平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能
在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的
内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总结一下：如果不内存对齐，因为平台限制，会增加访问次数，降低效率。
那什么是结构体内存对齐呢？
结构体内存对齐：通过牺牲空间换取访问效率的方式叫做内存对齐
来看图解：
在这里插入图片描述
那在设计结构体的时候，我们既要满足对齐，又要节省空间，
如何做到：
让占用空间小的成员尽量集中在一起。
来看例题：

在这里插入图片描述
如何计算？首先得掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处。
结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍
第一个是无需对齐的，但是每一个对齐数要能被偏移量整除，包括第一个数据的对齐数。

#pragma pack(8)//设置默认对齐数为8

结论：
结构在对齐方式不合适的时候，我么可以自己更改默认对齐数。
附：
还有一种说法是，编译器没有对齐数，其实就是自身大小。我的理解是：编译器默认最大对齐数，是数据类型中占字节最大的数字，所以无论怎么比较，都是当前数据的自身大小。

结构体传参

直接上代码：

struct S
{
    
    
 int data[1000];
 int num;
};
struct S s = {
    
    {
    
    1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
    
    
 printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
    
    
 printf("%d\n", ps->num);
}
int main()
{
    
    
 print1(s);  //传结构体
 print2(&s); //传地址
 return 0;
}

上面的 print1 和 print2 函数哪个好些？
答案是：首选print2函数。原因：
函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能
的下降。
结论：结构体传参的时候，要传结构体的地址。

位段

结构体讲完就得讲讲结构体实现位段的能力。
什么是位段：
位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 或者char。
位段的成员名后边有一个冒号和一个数字。

为什么存在位段？
位段是一种压缩存储方案，只考虑空间使用率，不考虑代码使用效率的方案。
缺点：位段代码的可移植性差。
位段的内存分配：

位段的成员可以是 int、 unsigned int、 signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

//一个例子
struct S
{
    
    
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {
    
    0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的？

在这里插入图片描述
来做一道题：

int main()
{
    
    
  unsigned char puc[4];
  struct tagPIM
  {
    
    
    unsigned char ucPim1;
    unsigned char ucData0 : 1;
    unsigned char ucData1 : 2;
    unsigned char ucData2 : 3;
  }*pstPimData;
  pstPimData = (struct tagPIM*)puc;
  memset(puc,0,4);
  pstPimData->ucPim1 = 2; 
  pstPimData->ucData0 = 3;
  pstPimData->ucData1 = 4;
  pstPimData->ucData2 = 5;
  printf("%02x %02x %02x %02x\n",puc[0], puc[1], puc[2], puc[3]);
  return 0;
}

来看图解：

在这里插入图片描述

位段的跨平台问题

int 位段被当成有符号数
还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机
器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是
舍弃剩余的位还是利用，这是不确定的。
总结：
跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

枚举

枚举顾名思义就是一一列举，把可能的取值一一列举。

enum Day//星期
{
    
    
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};
enum Sex//性别
{
    
    
 MALE,
 FEMALE,
 SECRET
}；
enum Color//颜色
{
    
    
 RED,
 GREEN,
 BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常量。
这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。！！！
例如：

enum Color//颜色
{
    
    
 RED=1,
 GREEN=2,
 BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr =5;                //ok?

在这里插入图片描述
显然不可以，类型不同。

我们可以使用 #define 定义常量，为什么非要使用枚举？枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

分别说下应用场景。
#define：适合用于单独定义的常量，多个常量之间没有直接联系。
enum ：适合用于多个彼此之间有直接关系的常量，

联合（共用体）

联合类型的定义：
联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。
比如：

//联合类型的声明
union Un
{
    
    
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

在这里插入图片描述
面试题：
判断当前计算机的大小端存储
联合大小的计算
联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。
例如：

union Un1
{
    
    
 char c[5];
 int i;
};
union Un2
{
    
    
 short c[7];
 int i;
};
//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));