UTF8编码中文字符存入Oracle字符集ZHS16GBK后取出展示的问题

其他 2018-12-27 10:21:06 阅读次数: 0

文章目录

问题现象
原因与分析

解决办法
SQL代码
Java代码

测试结果

问题现象

Oracle字符集为ZHS16GBK。
某表某字段中存入的字符串是UTF8编码（也是够了）。
直接选出查看是乱码，如下：

鎴戝氨鏄嚭鏉ユ墦閰辨补鐨勶紒

用C++等调用OCI接口选出后，可以转换编码。
用Java通过JDBC选出后，如果存在奇数汉字，则会丢失部分内容（部分乱码）。
用Toad工具查看会报Ora-29275

原因与分析

可能JDBC在用选出内容时已经做了字符编码的转换（而C++等低级语言OCI接口没有）
即使是指定为二进制，指定编码方式都不行。
导致UTF8的汉字3字节编码，被当成了Ansi的2字节编码，奇数汉字最后一个字节在转换中丢失。

XXX,YYY,ZZZ -> XX,XY,YY,ZZ (丢一个Z)

解决办法

由于无法修改存入数据库时的程序，只能选出时处理。
考虑从Oracle选出内容的时候直接转换为每个字节的ASCII码（字符方式展现10进制ASCII）。
再在程序中用这些ASCII码，合成原始字符串。

SQL代码

select dump(content,1010) as content from SomeTable

选出内容将从上列中的字符串

鎴戝氨鏄嚭鏉ユ墦閰辨补鐨勶紒

变成

Typ=1 Len=30 CharacterSet=ZHS16GBK:
230,136,145,229,176,177,230,152,175,229,135,186,230,157,165,230,137,147,233,133,177,…

Hint：Dump语句的参数请查看Oracle帮助文档，也可以 dump(xx,10,yy,zz)等等。

Java代码

String s = "Typ=1 Len=30 : 230,136,145,229,176,177,230,152,175,229,135,186,230,157,165,230,137,147......";

String[] a = s.split(":");
String[] b = a[1].split(",");

byte[] c = new byte[b.length];
for (int i = 0; i < b.length; i++) {
	c[i]=(byte)Integer.parseInt(b[i].trim());
} 

String d = new String(c, "UTF-8");
System.out.println(d);

上面为简单的例子，容错等自行考虑。。。

测试结果

鎴戝氨鏄嚭鏉ユ墦閰辨补鐨勶紒

恢复正常显示：

我就是出来打酱油的！

猜你喜欢

转载自blog.csdn.net/ddrfan/article/details/85258227

UTF8编码中文字符存入Oracle字符集ZHS16GBK后取出展示的问题

谨慎修改Oracle数据库字符集（UTF8<->ZHS16GBK）

ORACLE11g数据库字符集从ZHS16GBK转为UTF8

ORACLE字符集“ALU32UTF8”更改成“ZHS16GBK”

oracle 修改字符集为ZHS16GBK

oracle更改字符集为zhs16GBK

oracle 修改字符集为ZHS16GBK oracle 修改字符集为ZHS16GBK

oracle11g更改字符集AL32UTF8为ZHS16GBK

Oracle 12c 数据库字符集ZHS16GBK改为AL32UTF8

Oracle 12c 数据库字符集AL32UTF8改为ZHS16GBK

oracle 12c 字符集修改 AL32UTF8 改为 ZHS16GBK

Oracle 11G 数据库字符集ZHS16GBK改为AL32UTF8

expdp 字符集从ZHS16GBK到AL32UTF8

oracle AL32UTF8 zhs16gbk 安装字符编码

oracle数据库字符编码utf-8改为ZHS16GBK

hive修改使用utf8编码支持中文字符集

oracle数据库字符集AL32UTF8修改为ZHS16GBK即从超集到子集

更改Oracle数据字符集_转为常用的ZHS16GBK

oracle 修改字符集修改为ZHS16GBK

oracle12c 修改字符集修改为ZHS16GBK

oracle11g 修改字符集修改为ZHS16GBK

Linux下修改Oracle字符集为ZHS16GBK

oracle11g 修改字符集ZHS16GBK

oracle11g 修改字符集修改为ZHS16GBK（其它字符集通用）

plsql 登录后，提示数据库字符集（AL32UTF8）和客户端字符集（ZHS16GBK）不一致

转载：修改 oracle xe 默认中文字符集成为：SIMPLIFIED CHINESE_CHINA.ZHS16GBK

ZHS16GBK的数据库导入到字符集为AL32UTF8的数据库

oracle数据库字符集为ZHS16GBK插入的韩文日文俄文变成问号

linux下oracl字符集修改(WE8ISO8859P1 --> ZHS16GBK)

ORA-12899 采用exp导入zhs16gbk双字节字符到utf8三字节字符

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)