Umformung von Behördendaten mit .melt()
Das Bureau of Labor Statistics (BLS) in den USA stellt oft Datenreihen in einem leicht lesbaren Format zur Verfügung – es hat für jeden Monat eine eigene Spalte und jedes Jahr ist eine eigene Zeile. Leider macht es dieses breite Format schwierig, diese Informationen im Zeitverlauf darzustellen. In dieser Übung wirst du mit .melt()
eine Tabelle des BLS mit Daten zur US-Arbeitslosenquote in ein Format umwandeln, das du visualisieren kannst. Du musst der Tabelle eine Datumsspalte hinzufügen und nach ihr sortieren, um die Daten korrekt darzustellen.
Die Daten zur Arbeitslosenquote wurden für dich in eine Tabelle namens ur_wide
geladen. Schau dir diese Tabelle am besten genauer an, bevor du mit der Übung beginnst.
Diese Übung ist Teil des Kurses
Daten mit pandas verknüpfen
Anleitung zur Übung
- Verwende
.melt()
, um alle Spalten vonur_wide
mit Ausnahme vonyear
zu entpivotieren, und stelle sicher, dass die Spalten mit den Monaten und Wertenmonth
bzw.unempl_rate
heißen. Speichere das Ergebnis alsur_tall
. - Füge eine Spalte namens
date
zuur_tall
hinzu, die die Spaltenyear
undmonth
im Jahr-Monat-Format zu einer größeren Zeichenkette kombiniert und in einen Datumsdatentyp konvertiert. - Sortiere
ur_tall
nach Datum und speichere dies alsur_sorted
. - Erstelle für
ur_sorted
ein Diagramm mitunempl_rate
auf der y-Achse unddate
auf der x-Achse.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()