MulaiMulai sekarang secara gratis

Imputasi KNN

Himpunan data hampir selalu memiliki fitur yang saling berkorelasi. Karena itu, penting untuk mempertimbangkannya sebagai faktor saat melakukan imputasi nilai hilang. Model Machine Learning memanfaatkan fitur-fitur dalam DataFrame untuk menemukan korelasi dan pola, lalu memprediksi fitur terpilih.

Salah satu model yang paling sederhana dan efisien adalah K Nearest Neighbors. Model ini mencari 'K' titik yang paling mirip dengan titik data yang ada untuk mengimputasi nilai hilang.

Dalam latihan ini, DataFrame diabetes sudah dimuat untuk Anda. Gunakan paket fancyimpute untuk mengimputasi nilai hilang pada DataFrame diabetes.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Petunjuk latihan

  • Impor KNN dari fancyimpute.
  • Salin diabetes ke diabetes_knn_imputed.
  • Buat objek KNN() dan tetapkan ke knn_imputer.
  • Imputasi DataFrame diabetes_knn_imputed.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import KNN from fancyimpute
___

# Copy diabetes to diabetes_knn_imputed
diabetes_knn_imputed = ___

# Initialize KNN
knn_imputer = ___

# Impute using fit_tranform on diabetes_knn_imputed
diabetes_knn_imputed.iloc[:, :] = ___
Edit dan Jalankan Kode