lisoaring python 字符串 编码

20171006 在写入txt中遇到生僻字,使用gb18030编码,而不是gb2312
 
20170528 在读取xml中中文,输出中文文件jpg中又出现编码错误
invalid mode ('wb') or filename: 'file/img/51190230001_\xe5\x88\x98\xe4\xbb\xb2\xe8\xb4\xa4.jpg'
办法:imgname_nocode='{}_{}.jpg'.format(name, key.encode("gbk"))
得到:51190230001_大坝(枢纽)全景照.jpg
 
20170113 在读取中文文件夹名,输出中文文件pdf中又出现编码错误
'\xb4\xa8\xcb\xae\xbd\xa8\xb9\xdc\xa3\xa82002\xa3\xa9655\xba\xc5
办法:fname=dir_listi.decode("gbk")
得到:川水建管(2002)65号  巴州区龙洞沟
 
20151228_读取mysql中utf-8字符后,写入sql为?????
Python 有办法将任意值转为字符串:将它传入repr() 或str() 函数。
 
20140101_python的中文编码问题
http://blog.163.com/lisoaring@126/blog/static/1920560620146143153318/
 
exp7:输出中文到xml文件
iso:解决python输出中文到xml文件ascii乱码问题  
修改.py文件里的默认编码
[python] 
import sys 
reload(sys) 
sys.setdefaultencoding('utf8') 
 
exp3:将读取的HTML中的utf8中文写入记事本
编码问题UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)  
author:lisoaring
program:html2txt.py
问题:将读取的HTML中的utf8中文写入记事本
如:[u'110101000000', u'\u4e1c\u57ce\u533a']
遇到:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
解决办法:
1、程序前加
# -*- coding: utf-8 -*-
2、该字符串的时候
        f.write(j.encode("gb2312")+"\t")
 
exp2:python中文转换url编码
http://blog.csdn.net/wangqiaoshi/article/details/9730247
 
exp5:Mapinfo是GB编码  
 
====================================================================================
exp1:
写入记事本中的TAB分隔符

\t

 
exp4:格式化字符串 1
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
f=open(r'f:/out.txt','w')
print >>f,'  <item id="%s" name="%s">\n    <numxiang>%s</numxiang>\n  </item>\n'%(11,"china",3)
f.close()
 
exp4-0:格式化字符串 2
file = open('file/img/{}_{}.jpg'.format(name, key), 'wb')
 
exp6:连接字符串
delimiter = ','
mylist = ['Brazil', 'Russia', 'India', 'China']
print delimiter.join(mylist)
exp6:字符串转数字转字符串
int()
str()
 
 
exp4-1:提取字符串中的数字
办法:正则
key="tb189"
i=re.findall(r"\d*",key)
##        print i
        j=int(i[2])%22
 
exp4-2:返回变量类型
办法:typy(a)
 
exp4-2:
Python中,添加写入数据到已经存在的Excel的xls文件,即打开excel文件,写入新数据
 
 
 
 
  

猜你喜欢

转载自www.cnblogs.com/fir/p/9610503.html