关于字符集

1.ASCII

最古老,纯英文字符集,一个字节,使用前7位。最高位为0,用来扩展的。128个英文字符。

凡是键盘能直接打出来的字符都是英文字符集。一共只有128个。

26*2=52  + 标点符号+  .;+-().$    =   128

ASCII字符集纯英文字符,只支持英语,占一个字节。

2^8=256个

留出一半,以供将来的扩展。

2.ISO_8859_1

    西欧字符集,西方文字的字符集,一个字节,最高位1,低七位和ASCII完全兼容。256西方字符。

欧洲 德国,法国,俄国把英文,德文,法文,俄文统称为西方字符集。

ISO_8859_1  别名  latin_1    占一个字节。

3.GB2312

    国标码:简体中文的字符集,6000多个汉字。

4.GBK

    国标码的扩充码:表示中华民族所有的汉字,包括简体的,繁体,甲骨文,篆书。。。,两多个。两个字节

5.BIG5

    台湾和香港指定繁体中文的字符集。一万多个繁体中文。两个字节。

    注意:GBK和BIG5都是两个字节,表示所有的繁体字,但是二者没有任何的转换关系,编码各不相同。  GBK,大陆,BIG5,香港台湾。

6.unicode

    支持世界所有语言文字字符集,两个字节。unicode中文字符集和gbk不兼容。

   unicode好在什么地方呢:ASCII和ISO_8859_1和unicode是兼容。

Unicode字符集究竟是个什么字符集

 可变长度的。1-6个字节不等。

  西方文字占1个字节,中文占2个字节

7.utf-8

  utf-8是unicode编码的存储编码,可变长度的。1-6个不等。

    纯英文:1个字节。

    西欧文字(法文,德文,俄文)ISO_8859_1:2个字节。

    汉字:三个字节。

猜你喜欢

转载自blog.csdn.net/ymy6666/article/details/81223641
今日推荐