MulaiMulai sekarang secara gratis

Kesalahan imputasi per variabel

Pada latihan sebelumnya Anda telah mengekstrak estimasi kesalahan imputasi dari keluaran missForest. Ini memberikan dua angka:

  • normalized root mean squared error (NRMSE) untuk semua variabel kontinu;
  • proportion of falsely classified entries (PFC) untuk semua variabel kategorik.

Namun, bisa jadi model imputasi berkinerja sangat baik untuk satu variabel kontinu tetapi buruk untuk variabel lainnya! Untuk mendiagnosis kasus seperti ini, cukup beri tahu missForest untuk menghasilkan estimasi kesalahan per variabel. Ini dilakukan dengan mengatur argumen variablewise ke TRUE.

Data biopics dan paket missForest sudah dimuat untuk Anda, jadi mari kita cermati kesalahannya!

Latihan ini adalah bagian dari kursus

Menangani Data Hilang dengan Imputasi di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)
Edit dan Jalankan Kode