【C语言进阶】深度剖析数据在内存中的存储


前言

本次主要以整型和浮点型在内存中的存储进行分析讲解。希望能对各位小伙伴有所帮助!
在讲本块内容之前,我们先简单了解一下内存组成以及分配方式。

一个由C/C++编译的程序占用的内存分为以下几个部分:

1、栈区(stack)— 由编译器自动分配释放 ,存放为运行函数而分配的局部变量、函数参数、返回数据、返回地址等。其操作方式类似于数据结构中的栈。(内存分配时,与堆相向而生,因此申请内存是有限的,运用不当,会出现栈溢出)

2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。分配方式类似于链表。

3、全局区(静态区)(static)—存放全局变量、静态数据、常量。程序结束后由系统释放。

4、文字常量区 —常量字符串就是放在这里的。 程序结束后由系统释放。

5、程序代码区—存放函数体(类成员函数和全局函数)的二进制代码。

内存分配有以下三种方式:

1.从静态存储区域分配

扫描二维码关注公众号,回复: 13173524 查看本文章

内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量,static变量。

2.在栈上创建(地址从大到小)

在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限。(栈上的变量都具有临时变量的特性)

3.从堆上分配(地址从小到大)

亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员自己负责在何时用free或delete释放内存。

动态内存的生存期由程序员决定,使用非常灵活,但如果在堆上分配了空间,就有责任回收它,否则运行的程序会出现内存泄漏,

频繁地分配和释放不同大小的堆空间将会产生堆内存碎块。(在程序关闭(运行结束)后,内存泄漏消失)


以下是本篇文章正文内容,下面案例可供参考

一 数据类型详细介绍

类型的基本归类

1.1 整形家族

char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]

1.2 浮点数家族

float
double

1.3 构造类型-(自定义类型)

数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

1.4 指针类型

int pi;
char pc;
float
pf;
void
pv;

1.5 空类型

void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型
//函数返回类型 void test();
//函数参数 void test(void);
//指针 void* p;

二 整形在内存中的存储

一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?

举个例子:int a=-10;
a 分配四个字节的空间,通过图示可以看到a在内存中的存储方式。

那如何存储?
来了解下面的概念:

原码、反码、补码

计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位
三种表示方法各不相同。

数据在内存中以2进制的形式存储
对于整数来说:
整数二进制有3种表示形式:原码、反码、补码
正整数:原码、反码、补码相同
负整数:原码、反码、补码要进行计算的
按照数据的数值直接写出的二进制序列就是原码
原码的符号位不变,其他位按位取反,得到的就是反码
反码+1,得到的就是补码

整数中在内存中存储的是补码,这又是为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同
时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需
要额外的硬件电路

咋们继续以a=-10为例,写出它的转化过程:

10000000000000000000000000001010-原码
11111111111111111111111111110101-反码
11111111111111111111111111110110-补码

通过二进制的补码转为十六进制为:ff ff ff f6

补充: (进制转换)

上面涉及到的进制转换有不懂的可以参考小编收藏的一位博主的博客,超链接如下:进制之间的转换(二进制、八进制、十进制、十六进制)

我们再返回来看a=-10在内存的存储:
在这里插入图片描述
它和我们得到的十六进制补码 ff ff ff f6 顺序有些不同,这又是为什么?这与大小端字节序有关。

三 大小端字节序介绍及判断

3.1 大小端介绍

什么是大端小端:

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。

举例:

在这里插入图片描述
由此就可以解释为什么a=-10是以 ff ff ff f6 的顺序存储的了,它是小端字节序存储。关于大小端字节序的内容大家可以下去详细了解并找一些题去做。

四 浮点型在内存中的存储

常见的浮点数:
3.14159
1E10(科学计数法)
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围:float.h中定义

3.1 一个例子

浮点数存储的例子:
在这里插入图片描述
输出结果:
在这里插入图片描述
根据上面例子可知,对于整数9,
以整型的形式读入再以整型的形式取出或者以浮点数形式的形式读入再以浮点数的形式取出,结果都正确。
但是以整型的形式读入再以浮点型的形式取出或者以浮点数的形式读入再以整型的形式取出,结果出现异常。
这就说明了一个问题:整数和浮点数在内存中存储的方式有所区别。

3.2 浮点数存储规则

上述例子 num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。

详细解读:
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。

举例
十进制的5.5,写成二进制是 101.1 ,相当于 1.011×2^2 。
那么,按照上面V的格式,可以得出s=0,M=1.011,E=2
在这里插入图片描述

IEEE 754规定:

1.对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
在这里插入图片描述
2.对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
在这里插入图片描述
IEEE 754对有效数字M和指数E,还有一些特别规定。

M的规定:

前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保
存24位有效数字。

指数E,情况就比较复杂

首先,E为一个无符号整数(unsigned int)

这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将
有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为
1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23
位00000000000000000000000,则其二进制表示形式为在这里插入图片描述

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,
有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于
0的很小的数字。

E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);

3.3 例子分析

下面,让我们回到一开始的例子:

第一部分:为什么 0x00000009 还原成浮点数,就成了 0.000000 ?
首先,将 0x00000009 拆分,得到第一位符号位s=0,后面8位的指数 E=00000000 ,最后23位的有效数
字M=000 0000 0000 0000 0000 1001。

9 -> 0000 0000 0000 0000 0000 0000 0000 1001

由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:

V=(-1)^0 × 0.00000000000000000001001×2^(-126) = 1.001×2^(-146)

显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

第二部分:
请问浮点数9.0,如何用二进制表示?还原成十进制又是多少?
首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。

9.0 -> 1001.0 ->(-1)01.00123 -> s=0, M=1.001,E=3+127=130

那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,
即10000010。
所以,写成二进制形式,应该是s+E+M,即

0 10000010 001 0000 0000 0000 0000 0000

这个32位的二进制数,还原成十进制,正是 1091567616

总结


以上就是这次分享的全部内容。也许有的地方有些晦涩难懂,博主建议你们反复观看,下去能够找相关习题练习,亲身去感受数据在内存中的存储的奥妙之处。最后,送你们一句话:大家似乎更愿意相信“天分”这种虚无缥缈 的东西,而忽略了从小处做起、逐渐进步才能变得更好的自然 规律。学编程靠的真的不是天赋,是努力!

猜你喜欢

转载自blog.csdn.net/weixin_53306029/article/details/116505057