版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yzy199391/article/details/89478086
ASCII编码
一个字节
字母A
的ASCII编码为十进制的65
,二进制的01000001
。
Unicode编码
世界上所有语言都统一到一套编码中,通常为两个字节。
字母A
的ASCII编码为十进制的65
,二进制的00000000 01000001
(在ASCII编码基础上,在前面补8位0);
汉字中
,Unicode编码是十进制的20013
,二进制的01001110 00101101
。
⚠️缺点:文本中的英文用Unicode编码比ASCII编码需多一倍多存储空间。
UTF-8编码
解决上述存储空间浪费的问题,为"可变长编码":将Unicode字符根据不同的数字大小编码成1~6个字节,常用的英文字母被编码成一个字节,汉字通常是3个字节,生僻字编码成4~6个字节
⚠️好处:ASCII编码是UTF-8编码的一部分,ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。
计算机系统通用字符编码工作方式
计算机内存中,统一使用Unicode编码,传输或存储到硬盘时,为了节约空间,使用UTF-8编码。
-
记事本编辑
-
浏览网页