Quanto è sparso il mio insieme di dati?
La maggior parte degli insiemi di dati contiene valori mancanti, spesso rappresentati come NaN (Not a Number). Se stai lavorando con Pandas puoi verificare facilmente quanti valori mancanti ci sono in ogni colonna.
Scopriamo quanti degli sviluppatori che hanno partecipato al sondaggio hanno scelto di inserire la loro età (nella colonna Age di so_survey_df) e il loro genere (colonna Gender di so_survey_df).
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Subset the DataFrame
sub_df = ____
# Print the number of non-missing values
print(sub_df.____)