ARM_C高级学习笔记(六)大端模式和小端模式

(一)什么是大小端模式

  1. 大端模式(big endian)和小端模式(little endian)。最早是小说中出现的词,和计算机本来没关系的。
  2. 后来计算机通信发展起来后,遇到一个问题就是:在串口等串行通信中,一次只能发送1个字节。这时候我要发送一个int类型的数就遇到一个问题。int类型有4个字节,我是按照:byte0 byte1 byte2 byte3这样的顺序发送,还是按照byte3 byte2 byte1 byte0这样的顺序发送。规则就是发送方和接收方必须按照同样的字节顺序来通信,否则就会出现错误。这就叫通信系统中的大小端模式。这是大小端这个词和计算机挂钩的最早问题。
  3. 现在我们讲的这个大小端模式,更多是指计算机存储系统的大小端。在计算机内存/硬盘/Nnad中。因为存储系统是32位的,但是数据仍然是按照字节为单位的。于是乎一个32位的二进制在内存中存储时有2种分布方式:高字节对应高地址(大端模式)、高字节对应低地址(小端模式)
  4. 大端模式和小端模式本身没有对错,没有优劣,理论上按照大端或小端都可以,但是要求必须存储时和读取时按照同样的大小端模式来进行,否则会出错。
  5. 现实的情况就是:有些CPU公司用大端(譬如C51单片机);有些CPU用小端(譬如ARM)。(大部分是用小端模式,大端模式的不算多)。于是乎我们写代码时,当不知道当前环境是用大端模式还是小端模式时就需要用代码来检测当前系统的大小端。

(二)怎么测试大小端模式

1.用union来测试机器的大小端模式

#include <stdio.h>

// 共用体中很重要的一点:a和b都是从u1的低地址开始的。
// 假设u1所在的4字节地址分别是:0、1、2、3的话,那么a自然就是0、1、2、3;
// b所在的地址是0而不是3.

union myunion
{
	char a;
	int b;
}u1;
//小端模式返回1,大端模式返回0
int is_little_endian(void)
{
	u1.b = 1;
	return u1.a;
}
int main(void)
{
	int i = is_little_endian();
	if(i == 1)
	{
		printf("this is little endian.\n");
	}
	else
	{
		printf("this is big endian.\n");	
	}
	return 0;
}

2.用指针来测试机器的大小端模式

#include <stdio.h>

//小端模式返回1,大端模式返回0
int is_little_endian(void)
{
	int a = 1;
	char b = *((char *)&a);  // 指针方式其实就是共用体的本质
	return b;
}
int main(void)
{
	int i = is_little_endian();
	if(i == 1)
	{
		printf("this is little endian.\n");
	}
	else
	{
		printf("this is big endian.\n");	
	}
	return 0;
}

(四)看似可行实则不行的测试大小端方式:位与、移位、强制类型转化

  1. 位与运算。
  • 结论:位与的方式无法测试机器的大小端模式。(表现就是大端机器和小端机器的&运算后的值相同的)
  • 理论分析:位与运算是编译器提供的运算,这个运算是高于内存层次的(或者说&运算在二进制层次具有可移植性,也就是说&的时候一定是高字节&高字节,低字节&低字节,和二进制存储无关)。
  1. 移位
  • 结论:移位的方式也不能测试机器大小端。
  • 理论分析:原因和&运算符不能测试一样,因为C语言对运算符的级别是高于二进制层次的。右移运算永远是将低字节移除,而和二进制存储时这个低字节在高位还是低位无关的。
  1. 强制类型转换
  • 同上
  1. 实例
#include <stdio.h>

int main(void)
{
	// 强制类型转换
	int a;
	char b;
	a = 1;
	b = (char)a;
	printf("b = %d.\n", b);
	
/*
	// 移位
	int a, b;
	a = 1;
	b = a >> 1;
	printf("b = %d.\n", b);
	*/
/*
	// 位与
	int a = 1;
	int b = a & 0xff;		// 也可以写成:char b = a & 0x01;
	printf("b = %d.\n", b);
*/

	return 0;
}

(五)通信系统中的大小端(数组的大小端)

  1. 譬如要通过串口发送一个0x12345678给接收方,但是因为串口本身限制,只能以字节为单位来发送,所以需要发4次;接收方分4次接收,内容分别是:0x12、0x34、0x56、0x78.接收方接收到这4个字节之后需要去重组得到0x12345678(而不是得到0x78563412).
  2. 所以在通信双方需要有一个默契,就是:先发/先接的是高位还是低位?这就是通信中的大小端问题。
  3. 一般来说是:先发低字节叫小端;先发高字节就叫大端。(我不能确定)实际操作中,在通信协议里面会去定义大小端,明确告诉你先发的是低字节还是高字节。
  4. 在通信协议中,大小端是非常重要的,大家使用别人定义的通信协议还是自己要去定义通信协议,一定都要注意标明通信协议中大小端的问题。
发布了21 篇原创文章 · 获赞 6 · 访问量 413

猜你喜欢

转载自blog.csdn.net/weixin_44112805/article/details/105210098