Imputazione con media e mediana
L'imputazione dei valori mancanti è spesso la scelta migliore quando devi gestire grandi quantità di dati. I metodi più semplici per imputare includono l'inserimento di una costante, della media della variabile o di altre statistiche di base come la mediana e la moda.
In questo esercizio imputerai i valori mancanti usando media e mediana per ciascuna colonna. Il DataFrame diabetes è già stato caricato. Anche SimpleImputer() da sklearn.impute è stato importato per te.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)
# Create mean imputer object
mean_imputer = SimpleImputer(___=___)
# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)