- Unicode并不是一种编码方式,只是为每一个文字、符号分配了唯一的数字编号。编号范围从0x000000到0x10FFFF(0-1114111),Unicode编号写成16进制并在前面加U+。具体的编码方式有UTF-8、UTF-16、UTF-32
- 在 Java内部进行字符处理时,采用的都是Unicode,具体编码格式是UTF-16BE( 使用两个或四个字节表示一个字符 )。Unicode编号范围在65536以内的占两个字节,超出范围的占四个字节,BE (Big Endian)就是先输出高位字节,再输出低位字节,这与整数的内存表示是一致的。
- char本质上是一个固定占用两个字节的无符号正整数( 0-65535 ),正整数对应于Unicode编号。
- 由于char 固定占用两个字节,所以只能表示Unicode编号在65536以内的字符,而不能表示超出范围的字符。(超出范围使用String类来表示 )
Java char字符
猜你喜欢
转载自blog.csdn.net/weixin_43956248/article/details/113889032
今日推荐
周排行