编码集

  1. ASCII字符集每个字符用7位来表示,因此这个字符集中有128个字符,包括大小写拉丁字母、数字和标点符号。
  2. 扩展ASCII,原来的ASCII字符集经过扩展包括了另外128个字符,每个字符用8位来表示。
  3. ISO标准化的ISO-8859-1,每个字符用8位来表示。这个字符集包含用西欧各种语言编写文本所需的所有字符。
  4. Unicode由一个叫做UnicodeConsortium的非营利组织开发的字符集,试图将所有语言中的字符包括到一个字符集中,起初用16位来表示,足以表示65000个不同字符,后来为了表示更多用32位
    Unicode可以所哟语言的字符提供足够的空间,但是存储和传送Unicode文本没有存储和传送ASCII和Latin-1字符那样高效。可以通过字符编码来使存储和传送Unicode文本更高效。
    UTF-8:把Unicode转换成一种长度可变的字节编码,与熟悉的ASCII字符集对应的Unicode字符有着和ASCII一样的字节值,
    UTF-16:所有更为常用的字符归入一个16位代码单元,其他不常用的字符通过一对16位代码单元来存取。

Java除注释、标识符、字符、字符串内容外,几乎所有的输入元素都使用ASCII。对于这些除外的内容,Java支持Unicode字符,既可以用英文以外的语言来写注释,标识符和字符串。

猜你喜欢

转载自blog.csdn.net/Han_L/article/details/79915815