Bandingkan imputasi KNN dan median
Semua langkah pra-pemrosesan dalam fungsi train() terjadi pada himpunan pelatihan di setiap lipatan validasi silang, sehingga metrik galat yang dilaporkan sudah mencakup dampak pra-pemrosesan.
Ini termasuk metode imputasi yang digunakan (misalnya knnImpute atau medianImpute). Hal ini berguna karena memungkinkan Anda membandingkan berbagai metode imputasi dan memilih yang performanya terbaik pada data di luar sampel.
median_model dan knn_model tersedia di workspace Anda, begitu juga resamples yang memuat hasil resampling dari kedua model. Lihat hasil model dengan menjalankan
dotplot(resamples, metric = "ROC")
dan pilih yang performanya terbaik di luar sampel. Metode imputasi mana yang menghasilkan skor ROC di luar sampel tertinggi untuk model glm Anda?
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga