字符编码与二进制

二进制

为什么计算机是二进制的?
    因为计算机发展到电子计算机时代时。计算机的构成原件—晶体管。电脉冲每次经过晶体管时,出现的只有“通”和“不通”两种状态。又由于电脉冲次数可以达到每秒钟几百万甚至更高量级,晶体管的不同状态就如同算盘上的算珠,可以按照编好的程序计算运行。所以既然只有两种状态,计算机也就采用了二进制,只需要认识0 和1 即可,进位时“逢二进一”,借位时“借一当二”,非常简单方便,不仅可以用电子方式实现,而且很容易进行逻辑运算,提高了计算机的准确性和实用性。


二进制运算法制:
0+0=0;0+1=1;1+1=0;

0×0=0; 0×1=0;1×1=1;

为什么我们平时察觉不到二进制?

因为当我们使用电脑时,计算机中的进制转换程序会自动将二进制转换为十进制并显示在电脑屏幕上。


字符编码

    对于python编码,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ASCII码)
ASCII(American Standard Code for Information Interchange,美国标准信息交换码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。ASCII码最多只能表示255个符号。(1byte=8bit   则:2^8=255)
Unicode(万国码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 ^16 = 65536.
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,是对Unicode编码的压缩和优化。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符,他不再使用最少使用2个字节的标准,而是将所有的字符和符号进行分类(ASCII码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存)。


-----
小菜鸡一枚,希望各位多多指导!

猜你喜欢

转载自blog.csdn.net/liu1340308350/article/details/79097519