Heatmaps com cluster
Heatmaps são muito úteis para visualizar uma matriz de correlação, mas os clustermaps são ainda melhores. Um clustermap permite revelar a estrutura em uma matriz de correlação ao produzir um heatmap com agrupamento hierárquico:
df_corr = df.corr()
fig = sns.clustermap(df_corr)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
Para evitar sobreposição dos rótulos dos eixos, você pode acessar os Axes a partir do objeto fig e especificar a rotação. Você pode conhecer os argumentos da função clustermap() aqui.
Este exercício faz parte do curso
Visualizing Time Series Data in Python
Instruções do exercício
- Importe
seaborncomosns. - Calcule a correlação entre todas as colunas do DataFrame
meatusando o método de Pearson e atribua o resultado a uma nova variável chamadacorr_meat. - Plote o clustermap de
corr_meat.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import seaborn library
____
# Get correlation matrix of the meat DataFrame
corr_meat = ____(____)
# Customize the heatmap of the corr_meat correlation matrix and rotate the x-axis labels
fig = ____(corr_meat,
row_cluster=True,
col_cluster=True,
figsize=(10, 10))
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.show()