python实现jieba库分词制作词云

    《老人与海》是我最喜爱的一部外国名著,该作围绕一位老年古巴渔夫,与一条巨大的马林鱼在离岸很远的湾流中搏斗而展开故事的讲述。尽管海明威笔下的老人是悲剧性的,但他身上却有着尼采"超人"的品质,泰然自若地接受失败,沉着勇敢地面对死亡,这些"硬汉子"体现了海明威的人生哲学和道德理想,即人类不向命运低头,永不服输的斗士精神和积极向上的乐观人生态度。

    现在我们通过python来分析第一章中出现最多的单词,通过jieba库和word cloud库将里面出现的单词的频率图像化地表现出来。

一、新建一个记事本文件,并重命名为The old man and the sea

二、把《老人与海》第一章放到刚刚建立的txt文件里边

三、工具的准备,需要安装jieba库和wordcloud库    

from os import path

from wordcloud import WordCloud

import matplotlib.pyplot as plt

 

d=path.dirname(__file__)

text=open(path.join(d,"The old man and the sea.txt")).read()

 

# 步骤3-2:设置一张词云图对象

wordcloud = WordCloud(background_color="white", max_font_size=40).generate(text)

 

# 步骤4-1:创建一个图表画布

plt.figure()

# 步骤4-2:设置图片

plt.imshow(wordcloud, interpolation="bilinear")

# 步骤4-3:取消图表x、y轴

plt.axis("off")

# 显示图片

plt.show()

  

这里我出现了一点点小差错,因为我的pip版本是18.1的,我需要更新到19.0,否则无法安装wordcloud库

到这里终于完成jieba库和wordcloud库的安装!!!!!!!

三、编写代码

四、运行结果如下

    我们可以看到,出现最多的是boat和old man。

猜你喜欢

转载自www.cnblogs.com/daydayup12138/p/10646275.html
今日推荐