Compare imputação por KNN e mediana
Todas as etapas de pré-processamento na função train() acontecem no conjunto de treino de cada dobra da validação cruzada, então as métricas de erro reportadas já incluem os efeitos do pré-processamento.
Isso inclui o método de imputação usado (por exemplo, knnImpute ou medianImpute). Isso é útil porque permite comparar diferentes métodos de imputação e escolher aquele com melhor desempenho fora da amostra.
median_model e knn_model estão disponíveis no seu ambiente, assim como resamples, que contém os resultados reamostrados de ambos os modelos. Veja os resultados dos modelos executando
dotplot(resamples, metric = "ROC")
e escolha o que tiver melhor desempenho fora da amostra. Qual método de imputação produz o maior ROC fora da amostra para o seu modelo glm?
Este exercício faz parte do curso
Machine Learning com caret em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício