Prestazioni in-sample e out-of-sample
Un modello più sofisticato offre sempre prestazioni migliori? Come abbiamo visto nel video, questa è solo metà della verità.
I modelli overfitted colgono alla perfezione la struttura del set di addestramento ma non riescono a generalizzare a nuovi dati. Che seccatura! Alla fine, lo scopo principale di un modello predittivo è avere buone prestazioni su nuovi dati, giusto? Vai a indagare!
Sono già caricati l’ultimo modello dell’esercizio precedente, complex_model, e i tuoi dati di training e test (chocolate_train e chocolate_test).
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Predict on and combine with training data and calculate the error
predict(___, new_data = ___) %>%
___ %>%
mae(___,
___)