Grotere fouten, zwaardere straf
Alle fouten zijn verkeerd, maar niet alle fouten zijn even erg. Soms zijn grote voorspellingsfouten onevenredig schadelijker dan kleine fouten.
Grotere fouten, zwaardere straf — dat is een van de kenmerken van de root mean squared error (RMSE). Grote fouten worden gekwadrateerd, waardoor deze uitschieters zwaarder worden bestraft dan kleinere fouten.
Je kunt de RMSE als volgt berekenen, waarbij de \(i\)-de squared_diff het kwadraat is van de \(i\)-de fout.
$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$
In deze oefening bereken je de RMSE van je voorspellingen.
In je werkruimte staat het resultaat van de vorige oefening, test_enriched: de testdata met een nieuwe kolom .pred, de out-of-sample voorspellingen van het model.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Bereken de componentgewijze verschillen tussen de voorspellingen en de eindcijfers, kwadrateer ze, en sla ze op als
squared_diffs. - Gebruik de formule hierboven om de RMSE te berekenen en sla deze op als
rmse_manual. - Gebruik de functie
rmse()om de fout te berekenen en sla deze op alsrmse_auto. - Print
rmse_manualenrmse_autoom te controleren dat ze gelijk zijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the squared differences
squared_diffs <- (___ - ___)^___
# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)
# Compute the RMSE using a function
rmse_auto <- ___(___,
___,
___)
# Print both errors
___
___