Heatmaps avec regroupement (clustermaps)
Les heatmaps sont très utiles pour visualiser une matrice de corrélation, mais les clustermaps sont encore mieux. Un clustermap permet de révéler la structure d’une matrice de corrélation en produisant une heatmap avec regroupement hiérarchique :
df_corr = df.corr()
fig = sns.clustermap(df_corr)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
Pour éviter que les libellés d’axes ne se chevauchent, vous pouvez référencer les Axes à partir de l’objet fig sous-jacent et spécifier la rotation. Vous trouverez la liste des arguments de la fonction clustermap() ici.
Cet exercice fait partie du cours
Visualiser des séries temporelles en Python
Instructions
- Importez
seabornsous le nomsns. - Calculez la corrélation entre toutes les colonnes du DataFrame
meatavec la méthode de Pearson et affectez le résultat à une nouvelle variable appeléecorr_meat. - Tracez le clustermap de
corr_meat.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import seaborn library
____
# Get correlation matrix of the meat DataFrame
corr_meat = ____(____)
# Customize the heatmap of the corr_meat correlation matrix and rotate the x-axis labels
fig = ____(corr_meat,
row_cluster=True,
col_cluster=True,
figsize=(10, 10))
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.show()