Correlação entre várias séries temporais
No exercício anterior, você extraiu o componente seasonal de cada série temporal no DataFrame jobs e armazenou esses resultados em um novo DataFrame chamado seasonality_df. No contexto de dados de emprego, pode ser interessante comparar o comportamento sazonal, pois isso pode ajudar a revelar quais setores são mais parecidos ou mais diferentes.
Isso pode ser feito usando o DataFrame seasonality_df e calculando a correlação entre cada série temporal no conjunto de dados. Neste exercício, você vai aplicar o que aprendeu no Capítulo 4 para calcular e criar uma visualização de clustermap das correlações entre as séries temporais no DataFrame seasonality_df.
Este exercício faz parte do curso
Visualizing Time Series Data in Python
Instruções do exercício
- Calcule a correlação entre todas as colunas do DataFrame
seasonality_dfusando o método spearman e atribua o resultado aseasonality_corr. - Crie um novo clustermap da sua matriz de correlação.
- Imprima o valor da correlação entre as sazonalidades dos setores Government e Education & Health.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____
# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()
# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)