截取一个字符串的函数,输入为一个字符串和字节数,输出为为按字节截取的字符串,但是要保证汉字不会被截半个...

看面试程序时候看到一个这样的题目,自己用最基础的方式实现了一下。

题目:

截取一个字符串的函数,输入为一个字符串和字节数,输出为为按字节截取的字符串,但是要保证汉字不会被截半个,

如 “我ABC” 4,应该被截为“我AB”:输入“我ABC汉DEF”,应该输出为“我ABC”而不是“我ABC”+汉的半个。

题解:

 /**
     * 截取字符串方法
     * @param str
     * @param offset
     * @return
     * @throws UnsupportedEncodingException
     */
    public static String mySubstr(String str, int offset) throws UnsupportedEncodingException {
        byte[] bytes = str.getBytes("GBK");
        byte[] newByte = new byte[bytes.length];
        for (int i =0; i < bytes.length; i++) {
            if (i==offset-1) {
                if (bytes[i] < 0) {   //如果是负数,说明中文字符被截断了
                    break;
                }else {
                    newByte[i] = bytes[i];
                    break;
                }
            }
            newByte[i] = bytes[i];
        }
        return new String(newByte);
    }

说明:由于在编译器中默认是UTF-8格式,所以会出现中文占用为三个字节的问题,所以我在代码中将字符转为byte数组时候转为GBK的,这样的结果就是正确的。

发布了102 篇原创文章 · 获赞 49 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/SoWhatWorld/article/details/104996003
今日推荐