Comment dessiner un nuage de points de catégories à l'aide de la fonction striplot() ?

Il existe de nombreux types de données dans l'ensemble de données. Outre les variables caractéristiques continues, le type de données le plus courant est celui des données catégorielles, telles que le sexe, l'éducation, les loisirs, etc. Ces types de données ne peuvent pas être représentés par des variables continues. représenté par des données classifiées. Seaborn fournit des fonctions de visualisation spéciales pour les données catégorielles, qui peuvent être grossièrement divisées en trois types suivants :

Nuage de points de données catégorielles : swarmplot() et stripplot().

Diagrammes de distribution des données de classe : boxplot() et violinplot().

Graphiques d'estimation statistique pour les données catégorielles : barplot() et pointplot().

Ensuite, stripplot() est utilisé pour dessiner des nuages ​​de points de catégories. Le format syntaxique de la fonction stripplot() est le suivant.

seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, jitter=False)

Les significations des paramètres couramment utilisés dans les fonctions ci-dessus sont les suivantes :

(1) x, y, hue : entrée pour dessiner des données au format long.

(2) données : ensemble de données utilisé pour le dessin. Si x et y ne sont pas présents, il sera utilisé en format large, sinon il sera utilisé en format long.

(3) gigue : indique le degré de gigue (le long de l'axe des catégories uniquement). Lorsque de nombreux points de données se chevauchent, la quantité de gigue peut être spécifiée ou définie sur Tue pour utiliser la valeur par défaut.

Afin de permettre à chacun de mieux comprendre, tracez ensuite un nuage de points via la fonction stripplot(). L'exemple de code est le suivant.

# 获取tips数据
tips = sns.load_dataset("tips")
sns.stripplot(x="day", y="total_bill", data=tips)

Les résultats d'exécution sont présentés dans la figure ci-dessous.

Comme le montre la figure ci-dessus, l'abscisse du graphique est constituée de données classifiées et certains points de données se chevauchent, ce qui rend leur observation difficile. Afin de résoudre ce problème, vous pouvez passer le paramètre jitter lors de l'appel de la fonction striplot() pour ajuster la position de l'abscisse. L'exemple de code modifié est le suivant.

sns.stripplot(x="day", y="total_bill", data=tips, jitter=True)

Les résultats d'exécution sont présentés dans la figure ci-dessous.

De plus, la fonction swarmplot0 peut également être appelée pour dessiner un nuage de points. L'avantage de cette fonction est que tous les points de données ne se chevauchent pas et que la distribution des données peut être clairement observée. L'exemple de code est le suivant.

sns.swarmplot(x="day", y="total_bill", data=tips)

Les résultats d'exécution sont présentés dans la figure.

Je suppose que tu aimes

Origine blog.csdn.net/zy1992As/article/details/132581003
conseillé
Classement