Verificare i valori mancanti
Identificare i valori mancanti è fondamentale per l’analisi. Con lo stesso insieme di dati, otterrai il numero totale di valori mancanti iterando sia sulle righe sia sulle colonne del dataset. Una volta individuati i valori mancanti, servono ulteriori metodi per gestirli, ad esempio usando Imputer da sklearn. I valori mancanti vanno gestiti, altrimenti sarà difficile effettuare una corretta previsione del CTR.
I dati di esempio in forma di DataFrame sono caricati come df. pandas come pd è già disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Stampa un riepilogo di base delle colonne usando
.info(). - Stampa i valori mancanti per colonna usando
.isnull()(non dimenticare le parentesi!). - Stampa il numero totale di valori mancanti per riga usando
axis = 1e.sum().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)