Python 2.7中的中文字符串编码问题 - 代码天地

Python 2.7中的中文字符串编码问题

其他 2019-03-07 01:16:22 阅读次数: 0

版权声明： https://blog.csdn.net/Geroge_lmx/article/details/83896717

最近在利用python匹配数据库中文字符串中的某些关键字时，遇到了字符串编码问题：

'ascii' codec can't encode characters...'

下面就来讨论一下此类问题的解决方法，先从一些基本操作入手：

1. Linux Shell查看文件编码类型：

# vim 文件打开文件后
# :set fileencoding

备注：windows下可以使用spyder,notepad++等工具查看文件编码方式

2. 查看Oracle数据库字符集编码：

select * from nls_database_parameters where parameter ='NLS_CHARACTERSET'; #结果ZHS16GBK

3.方案：

1）中文字符串的编码默认情况下 = 代码文件的编码方式：

decode("文件编码") ----> 再encode("另一种编码")成指定的编码 ----> 使用指定编码解码decode("编码")

2）如果中文字符串在定义时采用 u"中文字符串" 格式，则对象被指定为unicode类型，编码格式与文件的编码方式无关：

encode("另一种编码")成指定的编码 ----> 使用指定编码解码decode("编码")

# -*- coding: utf-8 -*-

#s=u"厉害了，我的国"
s="厉害了，我的国" 
 
if isinstance(s, unicode): 
    #s=u"中文" 
    print s.encode('gb2312').decode('gb2312')
else: 
    #s="中文" 
    print s.decode('utf-8').encode('gb2312').decode('gb2312')

4.备注：

1）python2.7中decode()和encode()默认使用"ascii"解码/编码

2）可以使用sys.getdefaultencoding()函数查看默认编码方式

3）字符串在python内部表示为unicode码，因此在编解码转换时通常将unicode作为中间状态，先decode()为unicode,再进行编码，最后解码为自己期望的字符串编码。

猜你喜欢

转载自blog.csdn.net/Geroge_lmx/article/details/83896717

Python 2.7中的中文字符串编码问题

2019-11-6 python2.7中遇到的中文字符问题

python 判断字符串中是否只有中文字符

python判断字符串中是否只有中文字符

解决python的中文字符编码问题

Python读取中文字符编码问题

Python版解决中文字符串错误

python 判断中文字符串结尾

python - 实现中文字符串对齐的方法

visual studio 2015下python编程的中文字符串问题

Python3中的解决中文字符编码的问题

Python----使用正则re查找文本中特定中文字符串

python—获取字符串格式的序列的中文字符，判别和提取中文字符的方法

Python---Unicode中文字符串转换成 string字符串

Python 中文字符串比较相等，本地调试没问题，Python打包后出错

python中的编码以及解码问题（中文字符处理以及文件处理的某些注意事项）

笨办法学python之中文字符编码问题

Python爬虫开发：中文字符编码问题quote解决

python-检查是否为中文字符串

Python 中文字符串正则表达式

C++调用python代码中文字符串的传入传出（三）

（转）Python 用hashlib求中文字符串的MD5值

python中正则表达式在中文字符串匹配时的坑

python 提取中文字符串（utf-8）

python unicode编码转中文字符

Python中文编码问题(字符串前面加'u')

Python中文编码问题——字符串前面加u

python2.7--字符串和编码

关于python中中文字符切割乱码的问题

python中解决中文字符输出错误的问题（SyntaxError: Non-ASCII character）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)