编程时的编码、编码解码、编码乱码问题（ASCII、GBK、Unicode、UTF-32、UTF-8）

企业开发 2023-04-09 17:07:53 阅读次数: 0

编程时的编码、编码乱码问题（ASCII、GBK、Unicode、UTF-32、UTF-8）

1、ASCII (American Standard Code for Information Interchange)：美国信息交换标准代码是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。

在计算机中，所有的数据在存储和运算时都要使用二进制数表示（因为计算机用高电平和低电平分别表示1和0），例如，像a、b、c、d这样的52个字母（包括大写）以及0、1等数字还有一些常用的符号（例如*、#、@等）在计算机中存储时也要使用二进制数来表示，而具体用哪些二进制数字表示哪个符号，当然每个人都可以约定自己的一套（这就叫编码），而大家如果要想互相通信而不造成混乱，那么大家就必须使用相同的编码规则，于是美国有关的标准化组织就出台了ASCII编码，统一规定了上述常用符号用哪些二进制数来表示。

在这里插入图片描述

2、GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。

3、Unicode编码我们又可以叫做是统一码。在计算机科学领域中是一中业界标准，unicode编码还包含了字符集、编码方案等等。unicode编码给每个字符提供了一个唯一的数字，不论是什么平台、不论是什么程序、不论是什么语言。unicode编码的出现是为力更好的解决传统字符在编码产生的局此案问题。并且unicode编码给每种语言中的每个字符设定了统一并且唯一的二进制编码。

4、UTF-8、UTF-16 和 UTF-32 字符编码之间的主要区别在于它需要多少字节来表示内存中的字符。UTF-8 最少使用 1 个字节，而 UTF-16 最少使用 2 个字节。顺便说一句，如果字符的代码点大于 127，则 byte 的最大值则 UTF-8 可能需要 2、3 或 4 个字节，但 UTF-16 只会占用两个或四个字节。另一方面，UTF-32 是一种固定宽度的编码方案，总是使用 4 个字节来编码一个 Unicode 代码点。

在这里插入图片描述

UTF-8如果是一个字节的，第一位必须是0；如果是两个字节，第一个字节必须是110开头同时第二个字节必须是1开头；如果是三个字节，第一个字节必须是1110开头同时第二个字节必须是10开头同时第三个字节必须是10开头；第四个也是按如下图规律：

在这里插入图片描述

所以用某一种编码编写内容，然后用不同的另外一种编码解码，得到的内容就会不按照原来那套编码得到结果，也就出现乱码。

猜你喜欢

转载自blog.csdn.net/K_AAbb/article/details/127238207

编程时的编码、编码解码、编码乱码问题（ASCII、GBK、Unicode、UTF-32、UTF-8）

字符集、ASCII、GBK、UTF-8、Unicode、乱码、字符编码、解码问题等

Python 入门 26 —— ASCII 编码、Unicode 编码、 UTF-32、 UTF-16、 UTF-8、 GB2312 编码、 GBK 编码

ascii、unicode、utf-8、gbk编码

一听就能懂字符集、ASCII、GBK、Unicode、UTF-8、字符编码、解码、乱码问题的

字符编码旧题新解，纠缠不清的（ASCII，GBK， GB2312，GB18030，UNICODE，UTF-8，UTF-16，UTF-32）

ascii、unicode、utf-8、gbk编码区别及转换

编码方式ASCII、GBK、Unicode、UTF-8比较

字符编码ascii、unicode、utf-8、gbk 的关系

编码详解 ——包含ASCII、GBK、unicode、UTF-8等

ascii，unicode，gbk, utf-8, utf-16等字符编码问题

字符编码方式及判断整理（ANSI，Unicode,utf-8,utf-16,utf-32）

ASCII、Unicode、UTF-8、GBK、GB2312、解码、编码初体验

problem(4)一听就懂字符集、ASCII、GBK、UTF-8、Unicode、乱码、字符编码、解码问题的讲解

ASCII GBK UTF-8 编码

GBK、ANSI、Unicode、UTF-8编码

ASCII、Unicode、UTF-8编码关系

ASCII、ANSI、Unicode及UTF-8编码

Unicode,UTF-8,ASCII等字符编码

编码格式ASCII、Unicode、UTF-8

ASCII、Unicode、UTF-8编码

编码：ASCII 、UniCode、UTF-8

字符编码：ASCII Unicode UTF-8

字符编码ASCII、Unicode、UTF-8

编码：ASCII，Unicode 和 UTF-8

计算机编码知识，ASCII编码，GBK，Unicode，UTF-8编码详细介绍

编码字符集Unicode与字符编码UTF-8,UTF-16,UTF-32

unicode、gbk、iso8859-1、ascii、utf-8、utf-16、utf-32

ASCII，GBK，和Unicode的UTF-8，UTF-16，UTF-32阐述

python3 中的编码问题 unicode, utf-8, gbk, ascii

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)