IniziaInizia gratis

Imputazione con media e mediana

L'imputazione dei valori mancanti è spesso la scelta migliore quando devi gestire grandi quantità di dati. I metodi più semplici per imputare includono l'inserimento di una costante, della media della variabile o di altre statistiche di base come la mediana e la moda.

In questo esercizio imputerai i valori mancanti usando media e mediana per ciascuna colonna. Il DataFrame diabetes è già stato caricato. Anche SimpleImputer() da sklearn.impute è stato importato per te.

Questo esercizio fa parte del corso

Gestire i dati mancanti in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)

# Create mean imputer object
mean_imputer = SimpleImputer(___=___)

# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)
Modifica ed esegui il codice