JS字符编码----ASCII,Unicode 和 UTF-8

转:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

1.ASCII 码

使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。

其中最后一位用于奇偶校验。

2.Unicode

Unicode能够表示全世界所有的字节,Unicode最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)

 
utf8是对unicode字符集进行编码的一种编码方式

ASCII编码是1个字节,而Unicode编码通常是2个字节

3.GBK

GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

4. charset/encoding

  Charset (Character set) 字符集: 是对字符抽象表示的集合。包括世界上各种文字、符合和字符。i.e. unicode

  Encoding (Charset Encoding) 字符编码:建立字符集合和计算机系统对应的规则。简单来说就是,

扫描二维码关注公众号,回复: 6646711 查看本文章

  将字符转化为计算机可识别的二进制编码的规则。i.e. utf-8

猜你喜欢

转载自www.cnblogs.com/ljyqd/p/11096800.html