Imputasi mean & median
Melakukan imputasi nilai hilang adalah metode terbaik ketika Anda berhadapan dengan data dalam jumlah besar. Metode paling sederhana untuk mengimputasi nilai hilang mencakup mengisi dengan suatu konstanta atau rata-rata dari variabel, atau parameter statistik dasar lainnya seperti median dan modus.
Dalam latihan ini, Anda akan mengimputasi nilai hilang dengan mean dan median untuk setiap kolom. DataFrame diabetes telah dimuat untuk Anda. SimpleImputer() dari sklearn.impute juga telah diimpor untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)
# Create mean imputer object
mean_imputer = SimpleImputer(___=___)
# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)