Prestazioni in-sample
È molto importante capire se il tuo modello di regressione è utile oppure no. Un modello utile può essere quello che cattura bene la struttura del tuo insieme di dati di addestramento. Un modo per valutare queste prestazioni in-sample è fare previsioni sui dati di addestramento e calcolare l'errore assoluto medio di tutti i punti previsti.
In questo esercizio, valuterai le tue previsioni in-sample usando la MAE (mean absolute error). La MAE ti dice, in media, quanto si discostano le previsioni dai valori reali.
Si calcola con la seguente formula, dove \(n\) è il numero di previsioni effettuate:
$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{valore assoluto dell'errore }i\text{-esimo}$$
Nel tuo workspace è disponibile model, l'albero di regressione che hai costruito negli esercizi precedenti.
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Istruzioni dell'esercizio
- Crea
in_sample_predictionsusandomodelper prevedere sulla tibblechocolate_train. - Calcola un vettore
abs_diffsche contenga le differenze assolute tra le previsioni in-sample e i voti reali. - Calcola la mean absolute error secondo la formula sopra.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Predict using the training set
in_sample_predictions <- predict(model,
___)
# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)
# Calculate the mean absolute error
1 / ___ * ___