unicode 在python3中的编码问题

https://blog.csdn.net/sinat_40611238/article/details/79510373


u/U:表示unicode字符串 example:u"string"不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。 一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8

r/R:非转义的原始字符串 与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”\n”表示换行,”\t”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“\n”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。 以r开头的字符,常用于正则表达式,对应着re模块

b:表示bytes


unicode 是计算机的字符集 是密文 可以通过decode()函数进行解码成 string 字符串类型


明文 -> 编码 encode()-> 转换成密文
转换成明文 <- 解码 decode()<- 密文 
>>> s
'在'
>>> type(s)
<class 'str'>
>>> s.encode("utf-8")
b'\xe5\x9c\xa8'
>>> type(s.encode("utf-8"))
<class 'bytes'>

猜你喜欢

转载自blog.csdn.net/baidu_32542573/article/details/81778763