Correlaciones entre múltiples series temporales
En el ejercicio anterior, extraíste el componente seasonal de cada serie temporal del DataFrame jobs y guardaste esos resultados en un nuevo DataFrame llamado seasonality_df. En el contexto de los datos de empleo, puede resultar interesante comparar el comportamiento estacional, ya que esto puede ayudar a descubrir qué sectores son más similares o más diferentes.
Esto puede lograrse usando el DataFrame seasonality_df y calculando la correlación entre cada serie temporal del conjunto de datos. En este ejercicio, aplicarás lo que aprendiste en el Capítulo 4 para calcular y crear una visualización tipo clustermap de las correlaciones entre las series temporales del DataFrame seasonality_df.
Este ejercicio forma parte del curso
Visualización de datos temporales en Python
Instrucciones del ejercicio
- Calcula la correlación entre todas las columnas del DataFrame
seasonality_dfusando el método spearman y asigna los resultados aseasonality_corr. - Crea un nuevo clustermap de tu matriz de correlación.
- Imprime el valor de la correlación entre las estacionalidades de los sectores Government y Education & Health.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____
# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()
# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)