Corrélations entre plusieurs séries temporelles
Dans l’exercice précédent, vous avez extrait la composante seasonal de chaque série temporelle du DataFrame jobs et stocké ces résultats dans un nouveau DataFrame appelé seasonality_df. Pour des données sur l’emploi, il est intéressant de comparer les comportements saisonniers, car cela peut aider à identifier quels secteurs sont les plus similaires ou les plus différents.
Pour ce faire, on peut utiliser le DataFrame seasonality_df et calculer la corrélation entre chaque série temporelle du jeu de données. Dans cet exercice, vous allez mettre à profit ce que vous avez appris au chapitre 4 pour calculer et créer une visualisation en clustermap des corrélations entre les séries temporelles de seasonality_df.
Cet exercice fait partie du cours
Visualiser des séries temporelles en Python
Instructions
- Calculez la corrélation entre toutes les colonnes du DataFrame
seasonality_dfavec la méthode spearman et affectez le résultat àseasonality_corr. - Créez un nouveau clustermap à partir de votre matrice de corrélation.
- Affichez la valeur de corrélation entre les saisonnalités des secteurs Government et Education & Health.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____
# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()
# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)