Gestire i dati mancanti con fill e drop
Ahia… In questo insieme di dati ci sono un sacco di valori mancanti! Puliamolo! Con il file CSV caricato, elimina le righe che contengono valori null e mostra i risultati!
Ricorda: nel tuo workspace c'è già una SparkSession chiamata spark!
Questo esercizio fa parte del corso
Introduzione a PySpark
Istruzioni dell'esercizio
- Elimina tutte le righe con valori null nel DataFrame
census_df. - Mostra il DataFrame risultante.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____