Verken de Jobs-gegevensset

In deze oefening verken je het nieuwe DataFrame jobs, met het werkloosheidspercentage van verschillende sectoren in de VS tussen 2000 en 2010. Je ziet dat de gegevensset tijdreeksen bevat voor 16 sectoren en 122 tijdstippen (één per maand gedurende 10 jaar). In het algemeen omvat de typische workflow van een Data Science-project het opschonen en verkennen van data, dus we beginnen met het inlezen van de data en het controleren op ontbrekende waarden.

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in Python

Bekijk cursus

Oefeninstructies

We hebben pandas geïmporteerd als pd.

Lees het csv-bestand op url_jobs in als een DataFrame met de naam jobs en bekijk het gegevenstype van elke kolom.
Zet de kolom datestamp in jobs om naar het type datetime.
Stel de kolom datestamp in als de index van jobs.
Print het aantal ontbrekende waarden in elke kolom van jobs.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())

Code bewerken en uitvoeren