char可以存储汉字吗?| Java基础

可以!

[java]  view plain  copy
  1. public static void main(String[] args) {  
  2.                 char c='李';  
  3.                 System.out.println(c);  
  4.                 String s="周";  
  5.                 System.out.println(s);  
  6.         }  
  7. }  
[java]  view plain  copy
  1. 李  
  2. 周  
String存储汉字很好理解的,char是如何存储汉字的呢?

char是按照字符存储的,不管英文还是中文,固定占用占用2个字节,用来储存Unicode字符。范围在0-65536。
unicode编码字符集中包含了汉字,所以,char型变量中当然可以存储汉字啦。不过,如果某个特殊的汉字没有
被包含在unicode编码字符集中,那么,这个char型变量中就不能存储这个特殊汉字。
如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。
补充说明:
1. unicode编码固定占用两个字节,所以,char类型的变量也是占用两个字节。Unicode(统一码、万国码、
单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,
以满足跨语言、跨平台进行文本转换、处理的要求。传统的编码方式存在的缺陷:
       ①在不同的编码方案下有可能对应不同的字母

       ②采用大字符集的语言其编码长度可能不同
目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。

2. 不同的
看编码占据字节数也不同:utf-32中文是4字节;
    utf-8码的中文都是3字节的,字母是1字节,因为utf-8是变长编码;
    而 gbk/gbk18030 中文是2字
节的,英文是1个字节。

猜你喜欢

转载自blog.csdn.net/dingguanyi/article/details/80407983