哈工大LTP 词性标注失败,标记内容为空,Index out of range

问题

直接加载哈工大LTP中的词性标记模型,对已经分词的词语列表words进行标记,出现了标记后标记列表内容为空现象,正常情况下标记列表的长度与分词词语列表长度一致,并存有标记结果。
如图,出现错误" Index out of range "
原始代码:加载ltp词性标注模型对分词词语列表words进行词性标记标记后的postags长度为0
编译原始代码第58行:当postags为空时读取postags内容出现异常

出现原因

当词语为空时,LTP词性标记模型无法成功标记并抛出Index out of range异常。

解决方法

删除所有空行

  • notepad++文档打开分词文档(程序中是从文档读取并存储到列表)直接删除空行
  • 编写写入分词结果到文档中时过滤掉空行,或者在读取时过滤

正确结果

正确运行的结果

发布了8 篇原创文章 · 获赞 3 · 访问量 650

猜你喜欢

转载自blog.csdn.net/lehek/article/details/104116590
今日推荐