worldcloud.WorlCloud()库 & matplotlib.pyplot.imshow()库
点击打开链接:Python词云WordCloud & Jeiba 显示中文
一、worldcloud.WoldCloud()库
· 原文链接点击打开链接
· 翻译部分:
wordcloud.WordCloud(
font_path=None,
width=400,
height=200,
margin=2,
ranks_only=None,
prefer_horizontal=0.9,
mask=None,
scale=1,
color_func=None,
max_words=200,
min_font_size=4,
stopwords=None,
random_state=None,
background_color='black',
max_font_size=None,
font_step=1,
mode='RGB',
relative_scaling=0.5,
regexp=None,
collocations=True,
colormap=None,
normalize_plurals=True )
0. 常用参数:
- font_path:指明要用的字体的路径
- width:默认值400。设定词云画布的宽度
- height:默认值200。画布高度
- mask:默认无。用来设定词云的形状
- min_font_size:默认值4,整数类型。设定最小的词的尺寸/大小
- max_font_size:默认无,整数型。设定最大词的大小
- max_words:默认值200。设定词云最多显示的词的个数
- background_color:默认值为黑色。设定词云画布底色
- Scale:默认值1。值越大,图像密度越大越清晰
- color_func:默认无,可选参数一个“callable”。collable可以返回每个词的PIL色彩值,包括大小/位置/方向/字体格式/随机起始位置
1. 不常用参数
- stop_word:默认无。设定取词程序在某个词处停止
- prefer_horizontal:默认值0.90,浮点数类型。表示在水平如果不合适,就旋转为垂直方向,水平放置的词数占0.9?
- font_step:默认值1,整数型。对生成的词抽样,设定抽取的两个词之间略过的词的个数
- mode:默认值“RGB”,字符串型。或者使用“RGBA”产生透明背景
- relative_scaling:默认值0.5,浮点型。设定一个词和下一位词之间的大小倍数。有如下取值:“0”表示大小标准只有频率排名,“1”如果词频是2倍,大小也是2倍
- regexp:默认无,字符串类型。至于作用,笔者还没搞懂
- collocations: bool, default=True:默认为True,可选项为“bool”。决定词云是否可以包含两个词的搭配
- colormap: srting or matplotlib colormap, default='viridis':如果“color_func”指定,则失效;否则由matplotlib的色彩库为每个词随机定颜色
- normalize_plurals: bool, default=True:默认为True。默认True决定将词尾后缀‘s’删除,
二、matplotlib.pyplot.imshow()库
· 原文链接:点击打开链接
matplotlib.pyplot.imshow(
X,
cmap=None,
norm=None,
aspect=None,
interplotation=None,
alpha=None,
Vmin=None,
vmax= None,
origin=None,
extent=None,
shape=None,
filternorm=1,
filterrad=4.0,
imlim=None,
resample=None,
url=None,
hold=None,
data=None, **kwargs)
作用:将一个image显示在二维坐标轴上。
0. 常用参数
- X:类数组对象(array_like),shape(n,m) 或者(n,m,3)或者(n,m,4)
把X表示的图片显示在当前坐标轴中。X可以是类数组形式、或者PIL图片。如果X是类数组,它可以有如下3种情况&类型: · MxN - 用来作图的类数组值:float类型 / INT类型
· MxNx3 - RGB类数组值:float类型 / unit8类型
· MxNx4 - RGBA类数组值:float类型 / unit8类型
MxNx3和MxNx4的float类型类数组,取值范围限定为[0.0, 1.0]。MxN类数组是基于norm(采用标量对映射到标量方法作图)和cmap(将标准化标量映射为颜色)。
- interplotation:默认"None",可用字符串类型命令设定
可设定的字符串命令为:'none','nearest','bilinear','bicubic',‘spline16', 'spline36', 'hanning', 'hamming', 'hermite', 'kaiser','quadric','catrom','gaussian','bessel','mitchell', 'sinc','lanczos'
- 如果"None",默认rc image.interpolation。
- 如果是"none",则在Agg,ps和pdf后端不进行插值。其他后端将会落到“最近”。
图例:没有使用插值算法 VS 使用(bilinear)差值算法:
1. 不常用参数:
- cmap:默认"None",可设为 “colormap"
如果是“None”,默认rc值符合 image.cmap 。如果X是3-D,则cmap会被忽略,而采用 具体的RGB(A)值。
- aspect:默认"None",可设为['aotu' / 'equal' / scalar]
如果"None",默认rc值符合image.aspect,
如果"auto",则改变图片的横纵比、以便适应坐标轴的横纵比,
如果"equal",同时extent为"None",则改变坐标轴的横纵比、以便适应图片的;如果extent不为"None",则改变坐标轴的横纵比、以便适应与之匹配,
- norm:默认"None",可设为 Normalize
“Normalize(标准化)”,将2-D的X浮点值转化到[0, 1]区间,再作为cmap的输入值;如果norm是"None",则使用默认功能:normilize(标准化)/ 如果norm是比如"NoNorm",X必须是直接指向camp的查询表的整数数组,
- vmin,vmax:默认"None",可用标量类型命令设定
vmin和vmax和规范(norm)一起使用来规范(normlize)亮度数据。注:如果你忽略一个norm实例,你的vmin和vmax设定将会被忽略。
- alpha:默认"None",可用标量型命令设定
alpha混合值,介于0(透明)和1(不透明)之间
- origin:默认"None",可选