Esplora il dataset Jobs
In questo esercizio esplorerai il nuovo DataFrame jobs, che contiene il tasso di disoccupazione di diverse industrie negli USA negli anni 2000-2010. Come vedrai, l’insieme di dati contiene serie temporali per 16 industrie e 122 punti temporali (uno al mese per 10 anni). In generale, il tipico flusso di lavoro in Data Science prevede pulizia ed esplorazione dei dati, quindi inizieremo caricando i dati e verificando la presenza di valori mancanti.
Questo esercizio fa parte del corso
Visualizzare dati di serie temporali in Python
Istruzioni dell'esercizio
Abbiamo importato pandas come pd.
- Leggi il file csv situato in
url_jobsin un DataFrame chiamatojobse controlla il tipo di dato di ogni colonna. - Converte la colonna
datestampinjobsal tipodatetime. - Imposta la colonna
datestampcome indice dijobs. - Stampa il numero di valori mancanti in ciascuna colonna di
jobs.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())