IniziaInizia gratis

Esplora il dataset Jobs

In questo esercizio esplorerai il nuovo DataFrame jobs, che contiene il tasso di disoccupazione di diverse industrie negli USA negli anni 2000-2010. Come vedrai, l’insieme di dati contiene serie temporali per 16 industrie e 122 punti temporali (uno al mese per 10 anni). In generale, il tipico flusso di lavoro in Data Science prevede pulizia ed esplorazione dei dati, quindi inizieremo caricando i dati e verificando la presenza di valori mancanti.

Questo esercizio fa parte del corso

Visualizzare dati di serie temporali in Python

Visualizza il corso

Istruzioni dell'esercizio

Abbiamo importato pandas come pd.

  • Leggi il file csv situato in url_jobs in un DataFrame chiamato jobs e controlla il tipo di dato di ogni colonna.
  • Converte la colonna datestamp in jobs al tipo datetime.
  • Imposta la colonna datestamp come indice di jobs.
  • Stampa il numero di valori mancanti in ciascuna colonna di jobs.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())
Modifica ed esegui il codice