UTF-8格式txt文件读取字节前三位问题

今天试着读取一份UTF-8格式的txt文件,内容如下

12345

但是每次读取之后转为String类型,输出字符串长度总是为6,并且第一位打印在控制台后不占任何空间。

经过debug查看字节码后发现,在读取文件后的字节流中,前三位的字节分别是

-17,-69,-65

经过查看资料才发现,这是utf-8格式所带的特殊字节。凡是utf-8格式的文件文件,都会有这三个字节。

这种情况会导致对读取后的字符串进行截取时出现问题。

比如读取日期格式时,内容为2018-09-29 00:00:00,而我想要的是2018-09-29,可以通过方法substring转换。

s.substring(0,10)

但是转换出来的结果却是:2018-09-2。

这就是因为三个特殊字节被转换为字符串后占了一行空格。

猜你喜欢

转载自www.cnblogs.com/yxth/p/9725157.html