Desempenho in-sample e out-of-sample
Um modelo mais sofisticado sempre tem melhor desempenho? Como vimos no vídeo, isso é só metade da verdade.
Modelos com overfitting entendem perfeitamente a estrutura do conjunto de treinamento, mas não conseguem generalizar para novos dados. Que chato! No fim das contas, o principal objetivo de um modelo preditivo é ir bem em dados novos, certo? Vá investigar!
Já estão carregados o último modelo do exercício anterior, complex_model, e seus dados de treino e teste (chocolate_train e chocolate_test).
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Predict on and combine with training data and calculate the error
predict(___, new_data = ___) %>%
___ %>%
mae(___,
___)