Erkunde den Datensatz „Jobs“
In dieser Übung erkundest du das neue DataFrame jobs, das die Arbeitslosenquote verschiedener Branchen in den USA in den Jahren 2000–2010 enthält. Wie du sehen wirst, umfasst der Datensatz Zeitreihen für 16 Branchen und 122 Zeitpunkte (jeweils einen pro Monat über 10 Jahre). In der Regel gehören Datenbereinigung und Exploration zum typischen Workflow eines Data-Science-Projekts. Deshalb beginnen wir damit, die Daten einzulesen und auf fehlende Werte zu prüfen.
Diese Übung ist Teil des Kurses
Zeitreihendaten in Python visualisieren
Anleitung zur Übung
Wir haben pandas als pd importiert.
- Lies die CSV-Datei unter
url_jobsin ein DataFrame namensjobsein und prüfe den Datentyp jeder Spalte. - Konvertiere die Spalte
datestampinjobsin den Typdatetime. - Setze die Spalte
datestampals Index vonjobs. - Gib die Anzahl der fehlenden Werte in jeder Spalte von
jobsaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())