Korrelationen zwischen mehreren Zeitreihen
In der vorherigen Übung hast du die seasonal-Komponente jeder Zeitreihe im DataFrame jobs extrahiert und die Ergebnisse in einem neuen DataFrame namens seasonality_df gespeichert. Bei Jobdaten ist es spannend, die Saisonalität zu vergleichen, da das helfen kann, die ähnlichsten und die unterschiedlichsten Branchen zu erkennen.
Das erreichst du, indem du den DataFrame seasonality_df nutzt und die Korrelation zwischen den Zeitreihen im Datensatz berechnest. In dieser Übung wendest du dein Wissen aus Kapitel 4 an, um die Korrelationen zwischen den Zeitreihen in seasonality_df zu berechnen und als Clustermap zu visualisieren.
Diese Übung ist Teil des Kurses
Zeitreihendaten in Python visualisieren
Anleitung zur Übung
- Berechne die Korrelation zwischen allen Spalten in
seasonality_dfmit der Methode spearman und weise das Ergebnisseasonality_corrzu. - Erstelle eine neue Clustermap deiner Korrelationsmatrix.
- Gib den Korrelationswert zwischen den Saisonalitäten der Branchen Government und Education & Health aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get correlation matrix of the seasonality_df DataFrame
seasonality_corr = ____
# Customize the clustermap of the seasonality_corr correlation matrix
fig = ____(____, annot=True, annot_kws={"size": 4}, linewidths=.4, figsize=(15, 10))
plt.setp(fig.ax_heatmap.yaxis.get_majorticklabels(), rotation=0)
plt.setp(fig.ax_heatmap.xaxis.get_majorticklabels(), rotation=90)
plt.show()
# Print the correlation between the seasonalities of the Government and Education & Health industries
print(____)