Errori più grandi, penalità più grande
Tutti gli errori sono sbagliati, ma non tutti sono ugualmente gravi. A volte gli errori di previsione grandi sono sproporzionatamente più dannosi di quelli piccoli.
Errori più grandi, penalità più grande: è una delle caratteristiche della root mean squared error, o RMSE. Eleva al quadrato gli errori grandi, penalizzando questi outlier più severamente rispetto a quelli piccoli.
L'RMSE si può calcolare con la seguente formula, dove l’squared_diff in posizione \(i\) è il quadrato dell’errore in posizione \(i\).
$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$
In questo esercizio calcolerai l'RMSE delle tue previsioni.
Nel tuo workspace è disponibile il risultato dell’ultimo esercizio, test_enriched, i dati di test con una nuova colonna .pred, le previsioni out-of-sample del modello.
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Istruzioni dell'esercizio
- Calcola le differenze elemento per elemento tra previsioni e voti finali, elevale al quadrato e salvale come
squared_diffs. - Usa la formula sopra per calcolare l’RMSE e salvalo come
rmse_manual. - Usa la funzione
rmse()per calcolare l’errore e salvalo comermse_auto. - Stampa
rmse_manualermse_autoper verificare che coincidano.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the squared differences
squared_diffs <- (___ - ___)^___
# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)
# Compute the RMSE using a function
rmse_auto <- ___(___,
___,
___)
# Print both errors
___
___