python2与python3 字符问题以及 字符编码 内容总结

python2与python3默认编码:

   python2:gbk                   print( u'上' )     操作系统也是 gbk

     python3:unicode     print( '上’ )    

字符编码转换关系:

  unicode --》encode (编码)--》gbk  其他形式的二进制               write

  gbk  其他形式的二进制 --》decode (解码)--》unicode               read

各种编码格式与字节对应关系:

  bytes ; 字节

  ASCIL: 英文1个bytes,中文没有对应关系    ( 65-90:A-Z      97-122)    

  gbk ;  中文2个bytes,英文1个bytes

  unicode ;  中英文2个bytes

  utf-8: 中文3个bytes,英文一个bytes

  

文件头

  coding : utf-8

  x = '上'     文件头指定的 utf-8 就是 utf-8 的二进制 

  

  

猜你喜欢

转载自www.cnblogs.com/liu--huan/p/9497569.html