Compare imputação por KNN e mediana

Todas as etapas de pré-processamento na função train() acontecem no conjunto de treino de cada dobra da validação cruzada, então as métricas de erro reportadas já incluem os efeitos do pré-processamento.

Isso inclui o método de imputação usado (por exemplo, knnImpute ou medianImpute). Isso é útil porque permite comparar diferentes métodos de imputação e escolher aquele com melhor desempenho fora da amostra.

median_model e knn_model estão disponíveis no seu ambiente, assim como resamples, que contém os resultados reamostrados de ambos os modelos. Veja os resultados dos modelos executando

dotplot(resamples, metric = "ROC")

e escolha o que tiver melhor desempenho fora da amostra. Qual método de imputação produz o maior ROC fora da amostra para o seu modelo glm?

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício