Erkunde den Datensatz „Jobs“

In dieser Übung erkundest du das neue DataFrame jobs, das die Arbeitslosenquote verschiedener Branchen in den USA in den Jahren 2000–2010 enthält. Wie du sehen wirst, umfasst der Datensatz Zeitreihen für 16 Branchen und 122 Zeitpunkte (jeweils einen pro Monat über 10 Jahre). In der Regel gehören Datenbereinigung und Exploration zum typischen Workflow eines Data-Science-Projekts. Deshalb beginnen wir damit, die Daten einzulesen und auf fehlende Werte zu prüfen.

Diese Übung ist Teil des Kurses

Zeitreihendaten in Python visualisieren

Kurs anzeigen

Anleitung zur Übung

Wir haben pandas als pd importiert.

Lies die CSV-Datei unter url_jobs in ein DataFrame namens jobs ein und prüfe den Datentyp jeder Spalte.
Konvertiere die Spalte datestamp in jobs in den Typ datetime.
Setze die Spalte datestamp als Index von jobs.
Gib die Anzahl der fehlenden Werte in jeder Spalte von jobs aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())

Code bearbeiten und ausführen