Python_字符串与编码

1、字节、byte知识

一个字节8位,用来表示一个字符

1byte = 8bit 

二进制11111111 = 十进制255


2、编码知识

计算机是美国人发明,所以最早只有127个字符被编码到计算机。

SCII码: 0-127 (中文肯定不够用)

GB2312码:中文

Shift_JIS码:日文

Euc-kr码:韩国

Unicode码:把所有语言都统一到一套编码中

UTF-8码:可变长编码

例:“A”,ASCII码是十进制65,二进制01000001,用Unicode码二进制是00000000 01000001,在前面补8位0.

但明显英文用Unicode码存在浪费空间情况,所以就出现了UTF-8码。






猜你喜欢

转载自blog.csdn.net/qiangzai110110/article/details/80734094