乱码产生的原因

其他 2021-03-01 08:11:03 阅读次数: 0

乱码产生的原因一般有两种：

一种是解析错误；
另一种是在错误解析的基础上加上了编码转换。

（1）解析错误

比如一个GB2312编码的文件，使用UTF-8来打开，就会出现乱码。

这种情况下，只需要使用正确的编码方式即可解读。很多编辑器都有这个功能，如下图中的NotePad++：
avatar

（2）错误的解析和编码转换

使用编辑器如何改变编码方式都不对时，很有可能是文本在错误解析的基础上，还进行了编码转换。如下例子：
avatar

发送方以GBK编码发送，而接收方以UTF-8解码时，就会出现乱码现象。这时接收方想要查看正确的文本，就必须进行反向解析。将乱码以UTF-8编码得到的流再进行GBK解析，才能得到正确的文本。

在现实中，我们可能并不知道发送方和接收方的编码。所以应该以程序的方式进行如上的反向解析，如下：

    public static void main(String[] args) throws Exception {
//        byte[] gbkByte = "冥冥".getBytes(Charset.forName("GBK"));
//        String utf8Str = new String(gbkByte, "UTF-8");
//        System.out.println("得到乱码: " + utf8Str);

        String garbageCharacters = "ڤڤ";
        String[] charsets = new String[]{"GBK", "UTF-8", "Windows-1252"};   //可扩充
        //假设原来为encode编码,用decode解析成了乱码,下面进行反向操作
        for (String encode : charsets) {
            for (String decode : charsets) {
                if (!encode.equals(decode)) {
                    String newStr = new String(garbageCharacters.getBytes(decode), encode);
                    System.out.println("反向解析结果为:" + newStr + "，原来的编码为:" + encode + "，误解析为了:" + decode);
                }
            }
        }
    }

运行结果如下：
avatar
即可得到正确的文本。

注意：并不是所有乱码都是可恢复的，一些不能识别的字符，或经过多次编码和解析错误造成的乱码，都是难以恢复的。

猜你喜欢

转载自blog.csdn.net/hotmxdenergy/article/details/114240097

taomcat 乱码产生的原因

解析乱码产生的原因

乱码产生的原因

MySQL+PHP产生乱码原因---转载

乱码产生的原因是什么？

JSP中文乱码的产生原因及解决方案-转

Google Analytics乱码产生原因及解决方法

POST＆GET产生乱码的原因及解决方案

采用DoGet方式提交中文,乱码产生原因分析及解决办法

Tomcat关于encoding编码的默认设置以及乱码产生的原因

死锁产生的原因

单点登录的产生的原因

bug产生原因分析

1、Crash产生原因

卡顿产生的原因

静态功耗产生的原因

事物产生的原因

spark产生的原因

EOF产生错误的原因

区块链-产生原因

频偏产生的原因

内存碎片与产生原因

死锁，产生原因，避免

backspace 产生乱码的问题

乱码是如何产生的？

'Dead ReLU Problem' 产生的原因

(转)Broken pipe产生的原因

产生消失的梯度问题的原因

ConcurrentModifyException的产生原因及如何避免

侧链协议产生的原因

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)