Mulai sekarangMulai gratis

Imputasi mean & median

Melakukan imputasi nilai hilang adalah metode terbaik ketika Anda berhadapan dengan data dalam jumlah besar. Metode paling sederhana untuk mengimputasi nilai hilang mencakup mengisi dengan suatu konstanta atau rata-rata dari variabel, atau parameter statistik dasar lainnya seperti median dan modus.

Dalam latihan ini, Anda akan mengimputasi nilai hilang dengan mean dan median untuk setiap kolom. DataFrame diabetes telah dimuat untuk Anda. SimpleImputer() dari sklearn.impute juga telah diimpor untuk Anda gunakan.

Latihan ini merupakan bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)

# Create mean imputer object
mean_imputer = SimpleImputer(___=___)

# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)
Edit dan Jalankan Kode