CommencerCommencer gratuitement

Corrélations entre plusieurs séries temporelles

Dans l’exercice précédent, vous avez extrait la composante seasonal de chaque série temporelle du DataFrame jobs et stocké ces résultats dans un nouveau DataFrame appelé seasonality_df. Pour des données sur l’emploi, il est intéressant de comparer les comportements saisonniers, car cela peut aider à identifier quels secteurs sont les plus similaires ou les plus différents.

Pour ce faire, on peut utiliser le DataFrame seasonality_df et calculer la corrélation entre chaque série temporelle du jeu de données. Dans cet exercice, vous allez mettre à profit ce que vous avez appris au chapitre 4 pour calculer et créer une visualisation en clustermap des corrélations entre les séries temporelles de seasonality_df.

Cet exercice fait partie du cours

Visualiser des séries temporelles en Python

Afficher le cours

Instructions

  • Calculez la corrélation entre toutes les colonnes du DataFrame seasonality_df avec la méthode spearman et affectez le résultat à seasonality_corr.
  • Créez un nouveau clustermap à partir de votre matrice de corrélation.
  • Affichez la valeur de corrélation entre les saisonnalités des secteurs Government et Education & Health.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____

# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()

# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)
Modifier et exécuter le code