Sostituire i valori mancanti nascosti
Negli ultimi due esercizi hai lavorato sull'identificazione e la gestione dei valori mancanti durante l'importazione di un insieme di dati. In questo esercizio ti concentrerai sull'individuazione dei valori mancanti nascosti nei tuoi dati e su come gestirli. Userai il dataset diabetes, già caricato per te.
Nel DataFrame diabetes ci sono degli 0 nella colonna BMI. Ma il BMI non può essere 0. Dovrebbe invece essere NaN. In questo esercizio imparerai a riconoscere queste discrepanze. Eseguirai una semplice analisi dei dati per intercettare i valori mancanti e sostituirli. Sia numpy che pandas sono già stati importati come np e pd rispettivamente.
Inoltre, puoi esplorare il dataset stampandone, ad esempio, .head(), .info() ecc., per prenderci familiarità.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the description of the data
print(___)