Confronta imputazione KNN e mediana
Tutti i passaggi di preprocessing nella funzione train() avvengono nel set di training di ciascuna fold di cross-validation, quindi le metriche di errore riportate includono gli effetti del preprocessing.
Questo include il metodo di imputazione utilizzato (ad es. knnImpute o medianImpute). È utile perché ti permette di confrontare diversi metodi di imputazione e scegliere quello che funziona meglio fuori campione.
median_model e knn_model sono disponibili nel tuo workspace, così come resamples, che contiene i risultati ricalcolati di entrambi i modelli. Osserva i risultati dei modelli eseguendo
dotplot(resamples, metric = "ROC")
e scegli quello che funziona meglio fuori campione. Quale metodo di imputazione produce l’ROC più alto fuori campione per il tuo modello glm?
Questo esercizio fa parte del corso
Machine Learning con caret in R
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio