Geclusterde heatmaps
Heatmaps zijn erg handig om een correlatiematrix te visualiseren, maar clustermaps zijn nog beter. Een clustermap onthult structuur in een correlatiematrix door een hiërarchisch geclusterde heatmap te maken:
df_corr = df.corr()
fig = sns.clustermap(df_corr)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
Om overlappende aslabels te voorkomen, kun je verwijzen naar de Axes vanuit het onderliggende fig-object en de rotatie instellen. Meer over de argumenten van de functie clustermap() vind je hier.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Oefeninstructies
- Importeer
seabornalssns. - Bereken de correlatie tussen alle kolommen in de
meatDataFrame met de Pearson-methode en sla de resultaten op in een nieuwe variabelecorr_meat. - Plot de clustermap van
corr_meat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import seaborn library
____
# Get correlation matrix of the meat DataFrame
corr_meat = ____(____)
# Customize the heatmap of the corr_meat correlation matrix and rotate the x-axis labels
fig = ____(corr_meat,
row_cluster=True,
col_cluster=True,
figsize=(10, 10))
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.show()