windows上的中文文件名上传到linux上乱码问题解决 - 代码天地

windows上的中文文件名上传到linux上乱码问题解决

企业开发 2023-06-05 07:49:36 阅读次数: 0

问题描述

有很多多层文件夹存放的数据保存在windows上，文件夹和文件名均含有中文，将这些文件目录传到linux上，中文名显示乱码。

问题分析

windows上中文默认编码格式是gbk，而linux默认编码格式是utf-8，因此需要将文件名转码。

解决过程

1、linux工具convmv

# yum install convmv
convmv -f gbk -t utf-8 -r --notest .(文件夹路径）

部分文件夹及文件中文名可正常显示，但仍有两个问题：

1、部分中文路径显示：正在跳过，已经是 utf8”，乱码字符并未改变；
2、部分子文件夹下文件并未成功转码，仍是乱码。

2、python

解决第一个问题：

name = '乱码字符' # 拷贝linux下的乱码字符
new_name = name.encode('utf-8').decode('gbk') 
print(new_name) # 此时显示乱码字符的中文名称，在shell下重命名文件名即可，mv name new_name。

解决第二个问题：

convmv -r 应该是递归子文件夹，但仍存在部分子文件夹下文件名未进行转码，因此编写bash 脚本批量转码。

#!/bin/bash

func () {
    local dir="$1"
    for f in `ls $1`
    do
        if [ -f "$dir/$f" ]
        then
            echo "$dir/$f is file, pass"
        elif [ -d "$dir/$f" ]
        then
            convmv -f gbk -t utf-8 -r --notest "$dir/$f/"
            func "$dir/$f"
        fi
    done
}
func $1

./gbk2utf8.sh .(文件路径）

至此，两种方法结合，问题基本搞定。部分文件夹中文名无法用convmv转码的原因，初步分析应该是来源和其它的不一样，但用python可以获取到原来的中文名，进行重命名即可解决。附上python批量转码的代码。

def gbk2utf(dir_path):
    for root, dirs, files in os.walk(dir_path, topdown=False):
        for file_name in files:
            new_name = file_name.encode('utf-8').decode('gbk')
            new_path = os.path.join(root, new_name)
            old_path = os.path.join(root, file_name)
            os.rename(old_path, new_path)
        for dir_name in dirs:
            new_dir_name = dir_name.encode('utf-8').decode('gbk')
            new_dir_path = os.path.join(root, new_dir_name)
            old_dir_path = os.path.join(root, dir_name)
            os.rename(old_dir_path, new_dir_path)

# 查询字符串的编码格式
# import chardet
# chardet.detect(s)

猜你喜欢

转载自blog.csdn.net/jane_xing/article/details/129255244

windows上的中文文件名上传到linux上乱码问题解决

从windows ftp上传utf-8编码的linux，中文文件名乱码问题解决办法

Java中FTPClient上传中文目录、中文文件名乱码问题解决方法【好用】 Java中FTPClient上传中文目录、中文文件名乱码问题解决方法

从windows中文名文件上传到linux服务器上以后文件名会成乱码

nodejs adm-zip 解压文件中文文件名乱码问题解决

Java下载文件，中文文件名乱码问题解决（文件名包含很多%）

解决windows传送到linux下中文文件名及文件内容乱码问题

[Git配置]Git本地中文文件名问题解决 linux环境

SpringCloud通过网关上传文件文件名中文乱码问题解决

Java Web——文件下载时中文文件名乱码问题解决方案

中文名文件上传到linux服务器上以后文件名会乱码

中文名文件上传到linux服务器上以后文件名会乱码（openoffice）

解决java上传中文文件名乱码

Linux_解决windows传送到linux下中文文件名及文件内容乱码问题

Linux VPS上安装7zip使用教程及zip中文文件名解压乱码解决方法

使用HttpClient MultipartEntityBuilder 上传文件，并解决中文文件名乱码问题

不同浏览器上中文文件名的下载/导出乱码问题(Java)

linux中文文件名乱码解决

linux下中文文件名乱码解决

linux中文文件名乱码

linux 中文文件名乱码

解决linux下中文文件名显示乱码问题

Cherrypy文件上传非ASCII文件名乱码问题解决

【问题解决方案】本地代码文件上传到GitHub里中文乱码问题

window nginx 中文路径, 文件名乱码问题解决

SpringCloud上传文件，中文文件名乱码

webuploader上传文件，中文文件名乱码

文件名含中文，上传到FTP文件服务器文件名乱码 linux

SpringBoot上传文件，经过spingCloud-Zuul，中文文件名乱码解决办法

SpringCloud上传文件，中文文件名乱码解决办法

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)