目录
明确编码方式
- ASCII 讲英文的国家专用的编码方式
- GB2313 简体中文的字符集编码
- GBK 是GB2313的扩展
- GBK18030 繁体汉字的编码
- Unicode 万国码,编码界的最高中介
- ANSI
- UTF-8 他是Unicode的实现方式之一,一般python编码时都会申明该文件的编码方式就是UTF-8
- UTF-16
- UTF-8-BOM
- UCS-2 BigEndian
- UCS-2 Little Endian
常用的默认编码
- python3 默认编码方式是UTF-8
- python2 默认的编码方式是ascii
- windows 记事本默认编码方式是ANSI
- windows CMD 默认编码方式是GBK
- Linux 默认编码方式是UTP-8
各个编码之间的转换
- decode解码、encode编码。在python范围内,编程时如果遇到不同的编码方式可以通过decode方法和encode方法来做编码方式的转化。
- 编码和解码要以unicode作为中间编码,可以理解为先将其他编码类型的python对象解码为unicode,然后再从unicode编码方式encode编码为其他编码类型。
- 转换前需要先明确当前对象是什么类型的编码。
自动化框架中遇到的编码坑
- 在windows中,通过python3,生成.py文件,生成的文件默认编码格式是ANSI,这样会导致生成的.py文件无法正常运行,此时需要使用Notepad打开.py文件,菜单栏Encoding编码处选择Convert to UTF-8即可。更利于自动化测试的方法是在写文件的时候声明encoding参数,如 with open("a.txt", "w", encoding="utf-8") as fp 即可。
- 后续。