ComeçarComece de graça

Avalie os folds

Agora que você ajustou 10 modelos usando todos os 10 folds e calculou o MAE e o RMSE de cada um desses modelos, é hora de visualizar o tamanho dos erros. Assim, você desenvolve uma intuição sobre a distribuição do erro fora da amostra, o que ajuda a avaliar a qualidade do seu modelo.

Você vai plotar todos esses erros em um histograma e exibir as estatísticas resumidas em todos os folds.

O resultado do exercício anterior, fits_cv, já está pré-carregado.

Este exercício faz parte do curso

Machine Learning com modelos baseados em árvores em R

Ver curso

Instruções do exercício

  • Colete os erros fora da amostra de todos os modelos em fits_cv usando uma única função do yardstick e salve como all_errors.
  • Crie um histograma com ggplot2 usando .estimate como estética x e preencha (fill) as barras por .metric.
  • Use a mesma função do primeiro passo com summarize = TRUE para exibir estatísticas resumidas de fits_cv.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

library(ggplot2)

# Collect the errors
all_errors <- ___(___, summarize = ___)

# Plot an error histogram
ggplot(___, aes(___, ___)) +
        ___()

# Collect and print error statistics
___(fits_cv, ___)
Editar e executar o código