Prestatie binnen de trainingsset
Het is heel belangrijk om te weten of je regressiemodel nuttig is. Een nuttig model kan er een zijn dat de structuur van je trainingsset goed vastlegt. Een manier om deze prestatie binnen de trainingsset te beoordelen, is voorspellen op trainingsdata en de mean absolute error van alle voorspelde datapunten te berekenen.
In deze oefening beoordeel je je in-sample-voorspellingen met MAE (mean absolute error). MAE vertelt je ongeveer hoe ver de voorspellingen van de echte waarden afliggen.
Die wordt berekend met de volgende formule, waarbij \(n\) het aantal gedane voorspellingen is:
$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute waarde van de }i\text{e fout}$$
In je werkruimte staat je model, de regressieboom die je in de vorige oefeningen hebt gebouwd.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Maak
in_sample_predictionsdoormodelte gebruiken om te voorspellen op de tibblechocolate_train. - Bereken een vector
abs_diffsmet de absolute verschillen tussen de in-sample-voorspellingen en de echte beoordelingen. - Bereken de mean absolute error volgens de bovenstaande formule.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Predict using the training set
in_sample_predictions <- predict(model,
___)
# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)
# Calculate the mean absolute error
1 / ___ * ___