Bandingkan imputasi KNN dan median

Semua langkah pra-pemrosesan dalam fungsi train() terjadi pada himpunan pelatihan di setiap lipatan validasi silang, sehingga metrik galat yang dilaporkan sudah mencakup dampak pra-pemrosesan.

Ini termasuk metode imputasi yang digunakan (misalnya knnImpute atau medianImpute). Hal ini berguna karena memungkinkan Anda membandingkan berbagai metode imputasi dan memilih yang performanya terbaik pada data di luar sampel.

median_model dan knn_model tersedia di workspace Anda, begitu juga resamples yang memuat hasil resampling dari kedua model. Lihat hasil model dengan menjalankan

dotplot(resamples, metric = "ROC")

dan pilih yang performanya terbaik di luar sampel. Metode imputasi mana yang menghasilkan skor ROC di luar sampel tertinggi untuk model glm Anda?

Latihan ini merupakan bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Mulai latihan