版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u012535605/article/details/81709834
在利用结巴(jieba)进行分词时出现如下错误,AttributeError: 'float' object has no attribute 'decode': 真实挺无语的,当读取编码为utf8时不会报错,当读取为gbk时会报这类错误,这个可以解决很多此类型的错误。
原始内容:
def cutword(x):
seg = jieba.cut(x) #结巴分词函数
return ' '.join(seg)#
df['seg_word']=df['title'].apply(cutword)