Aan de slagBegin gratis

Prestatie binnen de trainingsset

Het is heel belangrijk om te weten of je regressiemodel nuttig is. Een nuttig model kan er een zijn dat de structuur van je trainingsset goed vastlegt. Een manier om deze prestatie binnen de trainingsset te beoordelen, is voorspellen op trainingsdata en de mean absolute error van alle voorspelde datapunten te berekenen.

In deze oefening beoordeel je je in-sample-voorspellingen met MAE (mean absolute error). MAE vertelt je ongeveer hoe ver de voorspellingen van de echte waarden afliggen.

Die wordt berekend met de volgende formule, waarbij \(n\) het aantal gedane voorspellingen is:

$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute waarde van de }i\text{e fout}$$

In je werkruimte staat je model, de regressieboom die je in de vorige oefeningen hebt gebouwd.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Bekijk cursus

Oefeninstructies

  • Maak in_sample_predictions door model te gebruiken om te voorspellen op de tibble chocolate_train.
  • Bereken een vector abs_diffs met de absolute verschillen tussen de in-sample-voorspellingen en de echte beoordelingen.
  • Bereken de mean absolute error volgens de bovenstaande formule.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Predict using the training set
in_sample_predictions <- predict(model,
                                 ___)

# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)

# Calculate the mean absolute error
1 / ___ * ___
Code bewerken en uitvoeren