python对utf-8的中文转换

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/jewely/article/details/84624480

python3默认支持utf-8,因此对于\uXXXX这种格式的中文,可以直接转换,但经常爬虫抓取回来的中文是\uXXXX格式,因此需要进行转换

s1='\u70ed\u95e8\u94ed\u6587\u63a8\u8350'
print('s1=',s1)

s2='\\u70ed\\u95e8\\u94ed\\u6587\\u63a8\\u8350'
print('s2=',s2)

s3=s2.encode('utf-8').decode('unicode_escape')
print('s3=',s3)
s1= 热门铭文推荐
s2= \u70ed\u95e8\u94ed\u6587\u63a8\u8350
s3= 热门铭文推荐

猜你喜欢

转载自blog.csdn.net/jewely/article/details/84624480