Umformung von Behördendaten mit .melt()
Das Bureau of Labor Statistics (BLS) in den USA stellt oft Datenreihen in einem leicht lesbaren Format zur Verfügung – es hat für jeden Monat eine eigene Spalte und jedes Jahr ist eine eigene Zeile. Leider macht es dieses breite Format schwierig, diese Informationen im Zeitverlauf darzustellen. In dieser Übung wirst du mit .melt() eine Tabelle des BLS mit Daten zur US-Arbeitslosenquote in ein Format umwandeln, das du visualisieren kannst. Du musst der Tabelle eine Datumsspalte hinzufügen und nach ihr sortieren, um die Daten korrekt darzustellen.
Die Daten zur Arbeitslosenquote wurden für dich in eine Tabelle namens ur_wide geladen. Schau dir diese Tabelle am besten genauer an, bevor du mit der Übung beginnst.
Diese Übung ist Teil des Kurses
Daten mit pandas verknüpfen
Anleitung zur Übung
- Verwende
.melt(), um alle Spalten vonur_widemit Ausnahme vonyearzu entpivotieren, und stelle sicher, dass die Spalten mit den Monaten und Wertenmonthbzw.unempl_rateheißen. Speichere das Ergebnis alsur_tall. - Füge eine Spalte namens
datezuur_tallhinzu, die die Spaltenyearundmonthim Jahr-Monat-Format zu einer größeren Zeichenkette kombiniert und in einen Datumsdatentyp konvertiert. - Sortiere
ur_tallnach Datum und speichere dies alsur_sorted. - Erstelle für
ur_sortedein Diagramm mitunempl_rateauf der y-Achse unddateauf der x-Achse.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()