Avalie os folds
Agora que você ajustou 10 modelos usando todos os 10 folds e calculou o MAE e o RMSE de cada um desses modelos, é hora de visualizar o tamanho dos erros. Assim, você desenvolve uma intuição sobre a distribuição do erro fora da amostra, o que ajuda a avaliar a qualidade do seu modelo.
Você vai plotar todos esses erros em um histograma e exibir as estatísticas resumidas em todos os folds.
O resultado do exercício anterior, fits_cv, já está pré-carregado.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Colete os erros fora da amostra de todos os modelos em
fits_cvusando uma única função doyardsticke salve comoall_errors. - Crie um histograma com
ggplot2usando.estimatecomo estéticaxe preencha (fill) as barras por.metric. - Use a mesma função do primeiro passo com
summarize = TRUEpara exibir estatísticas resumidas defits_cv.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
library(ggplot2)
# Collect the errors
all_errors <- ___(___, summarize = ___)
# Plot an error histogram
ggplot(___, aes(___, ___)) +
___()
# Collect and print error statistics
___(fits_cv, ___)