Imputasi KNN
Himpunan data hampir selalu memiliki fitur yang saling berkorelasi. Karena itu, penting untuk mempertimbangkannya sebagai faktor saat melakukan imputasi nilai hilang. Model Machine Learning memanfaatkan fitur-fitur dalam DataFrame untuk menemukan korelasi dan pola, lalu memprediksi fitur terpilih.
Salah satu model yang paling sederhana dan efisien adalah K Nearest Neighbors. Model ini mencari 'K' titik yang paling mirip dengan titik data yang ada untuk mengimputasi nilai hilang.
Dalam latihan ini, DataFrame diabetes sudah dimuat untuk Anda. Gunakan paket fancyimpute untuk mengimputasi nilai hilang pada DataFrame diabetes.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Petunjuk latihan
- Impor
KNNdarifancyimpute. - Salin
diabeteskediabetes_knn_imputed. - Buat objek
KNN()dan tetapkan keknn_imputer. - Imputasi DataFrame
diabetes_knn_imputed.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import KNN from fancyimpute
___
# Copy diabetes to diabetes_knn_imputed
diabetes_knn_imputed = ___
# Initialize KNN
knn_imputer = ___
# Impute using fit_tranform on diabetes_knn_imputed
diabetes_knn_imputed.iloc[:, :] = ___