Correlazioni tra più serie temporali
Nell’esercizio precedente, hai estratto la componente seasonal di ciascuna serie temporale nel DataFrame jobs e hai salvato i risultati in un nuovo DataFrame chiamato seasonality_df. Nel contesto dei dati sull’occupazione, può essere interessante confrontare il comportamento della stagionalità, perché questo può aiutare a capire quali settori lavorativi sono più simili o più diversi.
Puoi farlo usando il DataFrame seasonality_df e calcolando la correlazione tra ciascuna serie temporale nel dataset. In questo esercizio, metterai a frutto ciò che hai imparato nel Capitolo 4 per calcolare e creare una visualizzazione a clustermap delle correlazioni tra le serie temporali nel DataFrame seasonality_df.
Questo esercizio fa parte del corso
Visualizzare dati di serie temporali in Python
Istruzioni dell'esercizio
- Calcola la correlazione tra tutte le colonne del DataFrame
seasonality_dfusando il metodo Spearman e assegna i risultati aseasonality_corr. - Crea un nuovo clustermap della tua matrice di correlazione.
- Stampa il valore della correlazione tra le stagionalità dei settori Government e Education & Health.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____
# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()
# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)