1、多个变量,一起展示,形成n*n矩阵
2、默认情况下,PairGrid 只能展示数值变量
g = sb.PairGrid(data = df, vars = ['num_var1', 'num_var2', 'num_var3'])
#直方图放在对角线
g.map_diag(plt.hist)
#其余的放置散点图
g.map_offdiag(plt.scatter)
3、对于其他关系,PairGrid 函数的灵活性就被凸显出来了。比如我们想要观察数据中数值变量和分类变量之间的关系,就需要在行和列上设置不同的变量类型,然后再为每一个单元格设置不同的图表类型
g = sb.PairGrid(data = df, x_vars = ['num_var1', 'num_var2', 'num_var3'],y_vars = ['cat_var1','cat_var2'])
g.map(sb.violinplot, inner = 'quartile')
4、相关系数矩阵
.corr 函数的确可以非常完美地计算和返回相关系数的矩阵,df可以是df,也可以是列;annot是保留两位小数
sb.heatmap(df.corr(), annot = True, fmt = '.2f', cmap = 'vlag_r', center = 0)
默认的调色板是有序型的,但最好使用发散型的调色板,并且把中心数设为 0。这样的话,你就可以通过颜色的色调来判断两个变量之间是正相关还是负相关,并且能从色调的强度来判断这种关系的强弱。