1.上传包含中文文件的zip到服务器上后解压缩,使用unzip解压乱码的原因:
在windows上压缩的文件是以GBK、GB18030等编码格式压缩的。而一般Linux服务器的默认编码格式是UTF-8。unzip没有标明文件的编码格式的字段,将GBK的文件按照UTF-8解码,导致乱码。
2.解决方案:
2.1 使用rar格式上传,它会自动识别编码格式,自动转换。解压命令 unrar x 绝对路径(文件路径) 指导目录(解压到的目录)
例如:unrar x /opt/im_train_no/文件名 /opt/im_train_no
2.2 使用zip上传,中文文件名会出现乱码。
2.2.1 确认服务器上安装了p7zip和convmv
2.2.2 将脚本放到指定的目录下。
2.2.3 脚本的调用:
Process process = null;
if (cmd.startsWith("unzip")) {
process=Runtime.getRuntime().exec("/bin/sh /opt/cmd.sh");
System.out.println("process=" + process);
int i = process.waitFor();
/*
System.out.println("错误信息:");
BufferedReader input = new BufferedReader(new InputStreamReader(process.getErrorStream()));
String line = "";
while ((line = input.readLine()) != null) {
System.out.println(line);
}
input.close();
System.out.println("其他信息");
BufferedReader input2 = new BufferedReader(new InputStreamReader(process.getInputStream()));
String line2 = "";
while ((line2 = input2.readLine()) != null) {
System.out.println(line2);
}
input2.close();
*/
System.out.println("执行解压命令的返回结果:" + i);
System.out.println("0表示正常;1表示权限不够;其他的都表示错误。");
}else{
process=Runtime.getRuntime().exec(cmd);
System.out.println("process=" + process);
int i = process.waitFor();
/*
System.out.println("错误信息:");
BufferedReader input = new BufferedReader(new InputStreamReader(process.getErrorStream()));
String line = "";
while ((line = input.readLine()) != null) {
System.out.println(line);
}
input.close();
System.out.println("其他信息");
BufferedReader input2 = new BufferedReader(new InputStreamReader(process.getInputStream()));
String line2 = "";
while ((line2 = input2.readLine()) != null) {
System.out.println(line2);
}
input2.close();
*/
System.out.println("执行解压命令的返回结果:" + i);
System.out.println("0表示正常;1表示权限不够;其他的都表示错误。");
}
2.2.4 脚本:(红色的是目录可替换)
#!/bin/bash
LANG=zh_CN.UTF-8
convmv -f gbk -t utf8 --notest /o pt/im_train_no/*
7za x /opt/im_train_no/*.zip -o/opt/im_train_no/
rm -rf /opt/im_train_no/*.zip
convmv -r -f utf8 -t iso88591 /opt/im_train_no/* --notest --nosmart
convmv -r -f gbk -t utf8 /opt/im_train_no/* --notest --nosmart