IniziaInizia gratis

Eliminare righe

Quando sai che una colonna specifica sarà fondamentale per la tua analisi e solo una piccola parte delle righe ha un valore mancante in quella colonna, spesso ha senso rimuovere quelle righe dall'insieme di dati.

Durante questo corso, la colonna driver_gender sarà cruciale per molte delle tue analisi. Poiché solo una piccola frazione di righe è senza driver_gender, elimineremo quelle righe dall'insieme di dati.

Questo esercizio fa parte del corso

Analizzare l'attività di polizia con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Conta il numero di valori mancanti in ciascuna colonna.
  • Elimina tutte le righe a cui manca driver_gender passando il nome della colonna al parametro subset di .dropna().
  • Conta di nuovo i valori mancanti in ciascuna colonna, per verificare che nessuna delle righe rimanenti sia senza driver_gender.
  • Esamina lo .shape del DataFrame per vedere quante righe e colonne restano.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Count the number of missing values in each column
print(ri.isnull().____)

# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)

# Count the number of missing values in each column (again)
print(ri.____.____)

# Examine the shape of the DataFrame
print(____)
Modifica ed esegui il codice