编码GBK和GB2312、Unicode、UTF-8 - 代码天地

编码GBK和GB2312、Unicode、UTF-8

其他 2019-05-31 21:54:50 阅读次数: 0

一、编码GBK和GB2312

随着计算机发展，各国已经不满足于单纯用ASCII码；

对于我们来说能在计算机中显示中文字符是至关重要的，所以我们还需要一张关于中文和数字对应的关系表；

一个字节8位二进制，只能最多表示256个字符，要处理中文显然一个字节是不够的；

所以我们需要采用两个字节来表示，而且还不能和ASCII编码冲突；

所以1980年中国制定了GB2312编码，国家简体中文字符集，兼容ASCII；

1995年制定了GBK编码，GB2312的扩展字符集，支持繁体字，兼容GB2312。

注：在GBK和GB2312中，一个中文字符占两个字节，16个二进制位，4个十六进制位。

二、编码Unicode

全世界有上百种语言，日本把日文编到Shift_JIS里，韩国把韩文编到Euc-kr里；

各国有各国的标准，就会不可避免地出现冲突，结果就是，在多语言混合的文本中，显示出来会有乱码。

因此，1991年国际标准组织统一标准字符集，编码Unicode应运而生。

最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）

三、编码UTF-8

如果统一成Unicode编码，乱码问题从此消失了；

但是，Unicode编码最少用两个字节，ASCII码中英文是一个字节；

如果文本基本上全部是英文，用Unicode编码需要多一倍存储空间，存储和传输十分费劲。

1992年创建UTF-8编码，是一种针对Unicode的可变长度字符编码，又称万国码；

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节（每8位缩减），从而兼容所有编码，

英文字符1字节，欧洲字符2字节，中文字符3字节，只有很生僻的字符才会被编码成4-6个字节。

猜你喜欢

转载自www.cnblogs.com/relex/p/10957613.html

编码GBK和GB2312、Unicode、UTF-8

编码格式简介（ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE）

ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE 编码那些事儿

ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE网页编码

编码格式简介（ANSI、GBK、GB2312、UTF-8、UTF-16、GB18030和 UNICODE）

ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式比较分析

ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解

ASCII、Unicode、UTF-8、GB2312、GBK的关系

各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK)

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解

utf-8、unicode、gbk、gb2312、ANSI编码的区别

JAVA字符编码：Unicode,GBK,GB2312,UTF-8

中文字符编码：GB2312、GBK、ANSI、Unicode、UTF-8

unicode、utf-8、ansi、gbk、gb2312编码详解

各种字符编码方式详解及由来 (ANSI,UNICODE,UTF-8,GB2312,GBK)

ASCII、Unicode、UTF-8、GBK、GB2312、解码、编码初体验

关于gbk, gb2312，unicode，utf-8等字符编码的问题

JAVA字符编码系列一：Unicode,GBK,GB2312,UTF-8概念基础

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解（一）

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解（二）

unicode 、utf-8 、utf-16、ascii 、gbk 、gb2312之间的联系和区别

字符编码（ASCII,Unicode,Utf-8,GB2312…）

ANSI和ASCII、GBK和GB2312、Unicode和UTF-8的区别

ASCII、GB2312、GBK、Unicode、UTF-8介绍和转换

UTF-8、GB2312、GBK编码格式详解和编码示例

ASCII 、GB2312、GBK、GB18030、unicode、UTF-8字符集编码详解

常用字符集编码详解 ASCII GB2312 GBK GB18030 UTF-8 unicode

常用字符集编码详解：ASCII 、GB2312、GBK、GB18030、UTF-8、unicode

ASCII、GB2312、GBK、GB18030、Unicode、UTF-8、BIG5 编码分析详解(全网最全)

ASCII 、GB2312、GBK、GB18030、unicode、UTF-8字符集编码

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)