python编码基础知识

编码的初识:

  • 计算机存储文件,存储数据,以及一些数据通过网络发出去,存储发送数据什么内容? 底层都是二进制码。密码本:二进制与文字的对应关系

    • ASCII:最早的密码本(8)

      只包含英文字母,数字,特殊字符,一共不超过128个, 8bit = 1byte, 一个字符占1byte(字节)=8个二进制码
    • gbk :中国的密码本(8,16)

      包含英文字母,数字,特殊字符,中文。国家标准。一个英文字母和符号=1byte,一个中文用两个字节,能表示65536个中文字。
    • Unicode:万国码(32)

      把世界上所有的文字都记到这个密码本。起初一个字符用2个字节(byte)表示,后面为了涵盖所有文字用4个字节32位二进制表示,但是浪费空间。
    • Utf-8(8,16,32)

      Unicde升级而来
      英文: 1byte = 8位二进制
      欧洲: 2byte = 16位进制
      中,亚洲: 3byte = 24位二进制
      8bit = 1byte
      1024byte = 1kB
      1024kb = 1MB
      1024MB = 1GB
      1023GB = 1TB

猜你喜欢

转载自www.cnblogs.com/he-qing-qing/p/11297970.html