【wordcloud库】根据2021年工作报告采用wordcloud词云库显示报告中的关键词

使用wordcloud可以使一份文件更好地展示出其中的关键字,让用户更清楚直白地知道其重点要点。

问题描述: 

搜索2021年工作报告,保存其为文本文件,采用jieba库对报告进行分词,然后采用wordcloud词云库将报告中高频词强化突出,使结果更加直观,然后以图片保存。

需自己将2021年工作报告以正确的路径保存为文本文件,然后根据路径和文件名修改程序中的文件名。

为了生成的词云库图片以地图或其他形状显示,需要选择指定的图片作为背景,这里可以使用一个颜色比较深颜色为纯色的的版图,这样生成的图片更加美观  。由于这里放地图会违规,这里就不附图片了,如有需要请私信博主。

程序代码如下:

#词云库应用
import jieba
import wordcloud
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
I=np.array(Image.open("地图.png"))
excludes = {"各位代表"} #排除词库
txt = open("2021工作报告.txt", "r", encoding="utf-8")#保存的报告文件名
txt1=txt.read()
txt.close()
words = jieba.lcut(txt1)
ls=" ".join(words)
c=wordcloud.WordCloud(stopwords=excludes,font_path="C:/Windows/Fonts/STXINGKA.ttf",#字体设置电脑磁盘字体库中的一种字体
                      background_color='white',colormap='autumn',
                      mask=I,height=400,width=854,min_word_length=2,
                      prefer_horizontal=0.8,relative_scaling=0.8)
c.generate(ls)
c.to_file("wordcloudtest1.png")
plt.imshow(c)
plt.axis('off')
plt.show()

 程序运行结果的部分如下:

 

放地图会违规,这里仅截取部分展示 

得到的图片还是比较美观的,修改词云库的一些参数可以改变生成的图片效果,如有疑问欢迎留言提问,博主会尽快恢复。

别忘了给博主点个赞哦! 

猜你喜欢

转载自blog.csdn.net/qq_59049513/article/details/122526856