Aan de slagGa gratis aan de slag

Prestatie binnen de trainingsset

Het is heel belangrijk om te weten of je regressiemodel nuttig is. Een nuttig model kan er een zijn dat de structuur van je trainingsset goed vastlegt. Een manier om deze prestatie binnen de trainingsset te beoordelen, is voorspellen op trainingsdata en de mean absolute error van alle voorspelde datapunten te berekenen.

In deze oefening beoordeel je je in-sample-voorspellingen met MAE (mean absolute error). MAE vertelt je ongeveer hoe ver de voorspellingen van de echte waarden afliggen.

Die wordt berekend met de volgende formule, waarbij \(n\) het aantal gedane voorspellingen is:

$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute waarde van de }i\text{e fout}$$

In je werkruimte staat je model, de regressieboom die je in de vorige oefeningen hebt gebouwd.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Maak in_sample_predictions door model te gebruiken om te voorspellen op de tibble chocolate_train.
  • Bereken een vector abs_diffs met de absolute verschillen tussen de in-sample-voorspellingen en de echte beoordelingen.
  • Bereken de mean absolute error volgens de bovenstaande formule.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Predict using the training set
in_sample_predictions <- predict(model,
                                 ___)

# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)

# Calculate the mean absolute error
1 / ___ * ___
Code bewerken en uitvoeren