Unicode编码和utf-8编码的区别

其他 2020-01-17 11:34:10 阅读次数: 0

字符集：是一堆字符组成的集合，用来指定字节或者字符串映射成二进制的规则

　　　　（在计算机中存储的，无论是字节还是字符串都是以二进制模式存储的。）

1 Unicode编码的由来

因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数就是255

由于计算机是美国人发明的，因此，最早只有127个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母z的编码是122。

2 UTF-8编码

新的问题又出现了：如果统一成Unicode编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间：

从上面的表格还可以发现，UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。所以你看到很多网页的源码上会有类似<meta charset=”UTF-8″ />的信息，表示该网页正是用的UTF-8编码。

猜你喜欢

转载自www.cnblogs.com/ZZS-DYL/p/12204856.html

unicode和utf-8编码区别

UTF-8编码和Unicode，ASCII编码区别

Unicode编码和utf-8编码的区别

ASCII、Unicode和UTF-8编码的区别

字符编码中ASCII、Unicode和UTF-8的区别

ANSI、UTF-8和Unicode编码区别

编码方式ASCII、Unicode和UTF-8的区别及联系

unicode 和utf-8编码

unicode编码和utf-8的关系

编码：ASCII，Unicode 和 UTF-8

Unicode和UTF-8编码

unicode,ansi,utf-8,unicode big endian编码的区别

unicode编码和utf-8编码相互转换

浅谈unicode编码和utf-8编码的关系

关于Unicode编码和UTF-8编码

【转】关于Unicode编码和UTF-8编码

字符编码——ASCII，Unicode和UTF-8编码

【编码】ASCII、Unicode、GBK和UTF-8字符编码的区别联系

JAVA 编码之 ASCII、Unicode、GBK和UTF-8字符编码的区别联系

ascii、unicode、utf-8、gbk编码区别及转换

字符编码 ansi unicode utf-8 区别

字符编码：ANSI和ASCII区别、Unicode和UTF-8区别

字符编码ANSI和ASCII区别、Unicode和UTF-8区别

java基础字符、位和字节的区别？ASCII、Unicode和UTF-8编码的区别？

[理解]ASCII和Unicode和UTF-8编码问题

ASCII，Unicode，GBK和UTF-8字符编码的区别和联系

字符编码unicode，utf-8和ascii

字符编码笔记：ASCII，Unicode和UTF-8

【转】字符编码笔记：ASCII，Unicode 和 UTF-8

字符编码 ASCII,Unicode和UTF-8的关系

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)