Confronta imputazione KNN e mediana

Tutti i passaggi di preprocessing nella funzione train() avvengono nel set di training di ciascuna fold di cross-validation, quindi le metriche di errore riportate includono gli effetti del preprocessing.

Questo include il metodo di imputazione utilizzato (ad es. knnImpute o medianImpute). È utile perché ti permette di confrontare diversi metodi di imputazione e scegliere quello che funziona meglio fuori campione.

median_model e knn_model sono disponibili nel tuo workspace, così come resamples, che contiene i risultati ricalcolati di entrambi i modelli. Osserva i risultati dei modelli eseguendo

dotplot(resamples, metric = "ROC")

e scegli quello che funziona meglio fuori campione. Quale metodo di imputazione produce l’ROC più alto fuori campione per il tuo modello glm?

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza corso

esercizio interattivo pratico

Trasforma la teoria in pratica con uno dei nostri esercizi interattivi

Inizia esercizio