bson.errors.InvalidStringData: strings in documents must be valid UTF-8: ' \xe7\

bson.errors.InvalidStringData: strings in documents must be valid UTF-8: ' \xe7\x84\x89\xe8\x80\x86\xe5\x9b'

怎么解决??

solution:
uft-8 的汉字 占3个字节
因此取前两个字符 是这样的 vstr[0:6]  ,开始以为是 每个汉字占4个字节,用 vstr[0:8],怪不得 最后一个汉字后面会有“??”  这样在 vim 里 :set  fileencoding  显示 fileencoding=     而正常fileencoding=utf8

正是由于上面的原因 ,使得在python里不能正确的使用上面取到的汉字

猜你喜欢

转载自jacklin2015.iteye.com/blog/2263591