Kesalahan imputasi per variabel
Pada latihan sebelumnya Anda telah mengekstrak estimasi kesalahan imputasi dari keluaran missForest. Ini memberikan dua angka:
- normalized root mean squared error (NRMSE) untuk semua variabel kontinu;
- proportion of falsely classified entries (PFC) untuk semua variabel kategorik.
Namun, bisa jadi model imputasi berkinerja sangat baik untuk satu variabel kontinu tetapi buruk untuk variabel lainnya! Untuk mendiagnosis kasus seperti ini, cukup beri tahu missForest untuk menghasilkan estimasi kesalahan per variabel. Ini dilakukan dengan mengatur argumen variablewise ke TRUE.
Data biopics dan paket missForest sudah dimuat untuk Anda, jadi mari kita cermati kesalahannya!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)