字符串编码和字节解码 - 代码天地

字符串编码和字节解码

其他 2019-03-01 15:31:24 阅读次数: 0

本人以前就经常搞不清楚utf-8、unicode、字符串、二进制序列、编码、解码这几个之间的关系，趁今天有时间，赶紧写篇文章巩固这几个概念，免得以后又搞混了。

字符串是什么？

字符串就是字符序列，说得更通俗点，一串字符就是字符串。问题在于该如何给字符下定义？

2015年开始，“字符”的最好定义就是Unicode字符。python3的str对象里获取的元素就是unicode字符。

Unicode标准把字符的标识和具体的字节表述进行了明确的区分。

* 字符的标识，即码位，是 0~1 114 111 的数字（十进制），在 Unicode 标准中以 4~6 个

十六进制数字表示，而且加前缀“U+”。例如，字母 A 的码位是 U+0041，欧元符号的
码位是 U+20AC，高音谱号的码位是 U+1D11E。在 Unicode 6.3 中（这是 Python 3.4 使
用的标准），约 10% 的有效码位有对应的字符。

* 字符的具体表述取决于所用的编码。编码是在码位和字节序列之间转换时使用的算法。

在 UTF-8 编码中，A（U+0041）的码位编码成单个字节 \x41，而在 UTF-16LE 编码中
编码成两个字节 \x41\x00。再举个例子，欧元符号（U+20AC）在 UTF-8 编码中是三个
字节——\xe2\x82\xac，而在 UTF-16LE 中编码成两个字节：\xac\x20

把码位(Unicode字符)转换成具体字节的过程叫编码encode；把字节转换成码位(Unicode)的过程叫解码decode。

1 s = "中国人"
2 print(type(s))
3 #对Unicode字符串编码
4 bs = s.encode("utf-8")
5 #解码
6 print(bs.decode())

为了方便自己记忆，可以把字节序列想象成机器可以理解的二进制，Unicode字符串当成人类可以读的文本字串，那么吧二进制转换成人类可读的文本就是解码，把人类可读的文本转换成二进制进行存储或者网络传输的过程就是编码。

猜你喜欢

转载自www.cnblogs.com/forwardfeilds/p/10456496.html

字符串编码和字节解码

python 字节和字符串的转换解码和编码

Python 字符串&字节包编码和解码

字符串的编码解码

字符串编码解码

字符编码 and 字节和字符串转换（待补充）

字符串编码和解码，encodeURIComponent和decodeURIComponent用法

第六章：文件系统-codecs:字符串编码和解码-字节序

#Python中字符串的编码与解码

url字符串编码解码的方法

js的URL字符串编码/解码

JS中字符串的编码解码

编码与解码字符串中的

将图片文件转化为字节数组字符串，并对其进行Base64编码处理和对字节数组字符串进行Base64解码并生成图片

js对base64编码的字符串进行编码和解码

《笨方法学 Python 3》23.字符串、字节串和字符编码

字符串和编码

在Java中怎么计算字符编码和字符串所占字节数 .

字节串和字符串的区别

python 字符串编码解码和格式化问题

字符串、字符和字节

PHP开发-多字节字符串处理及字符编码

【转】Python字符串的编码与解码(encode与decode)

JS对URL字符串进行编码/解码分析

python3中的字符串的编码和解码

iOS开发-OC中特殊字符串编码解码

Python 标准库：codecs字符串编码和解码

Python笔记-对字符串进行URL编码及解码

【LeetCode（Java） - 271】字符串的编码与解码

牛客21805 字符串编码与解码

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)