MulaiMulai sekarang secara gratis

Imputasi mean & median

Melakukan imputasi nilai hilang adalah metode terbaik ketika Anda berhadapan dengan data dalam jumlah besar. Metode paling sederhana untuk mengimputasi nilai hilang mencakup mengisi dengan suatu konstanta atau rata-rata dari variabel, atau parameter statistik dasar lainnya seperti median dan modus.

Dalam latihan ini, Anda akan mengimputasi nilai hilang dengan mean dan median untuk setiap kolom. DataFrame diabetes telah dimuat untuk Anda. SimpleImputer() dari sklearn.impute juga telah diimpor untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)

# Create mean imputer object
mean_imputer = SimpleImputer(___=___)

# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)
Edit dan Jalankan Kode