Eliminare righe
Quando sai che una colonna specifica sarà fondamentale per la tua analisi e solo una piccola parte delle righe ha un valore mancante in quella colonna, spesso ha senso rimuovere quelle righe dall'insieme di dati.
Durante questo corso, la colonna driver_gender sarà cruciale per molte delle tue analisi. Poiché solo una piccola frazione di righe è senza driver_gender, elimineremo quelle righe dall'insieme di dati.
Questo esercizio fa parte del corso
Analizzare l'attività di polizia con pandas
Istruzioni dell'esercizio
- Conta il numero di valori mancanti in ciascuna colonna.
- Elimina tutte le righe a cui manca
driver_genderpassando il nome della colonna al parametrosubsetdi.dropna(). - Conta di nuovo i valori mancanti in ciascuna colonna, per verificare che nessuna delle righe rimanenti sia senza
driver_gender. - Esamina lo
.shapedel DataFrame per vedere quante righe e colonne restano.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Count the number of missing values in each column
print(ri.isnull().____)
# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)
# Count the number of missing values in each column (again)
print(ri.____.____)
# Examine the shape of the DataFrame
print(____)