Aan de slagGa gratis aan de slag

RMSE berekenen

In deze oefening bereken je de RMSE van je werkloosheidsmodel. In de vorige codeoefeningen heb je twee kolommen toegevoegd aan de unemployment-gegevensset:

  • de voorspellingen van het model (kolom predictions)
  • de residualen tussen de voorspellingen en de uitkomst (kolom residuals)

Je kunt de RMSE berekenen uit een vector met residualen, \(res\), als:

$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$

Je wilt dat de RMSE klein is. Hoe klein is "klein"? Een vuistregel is om de RMSE te vergelijken met de standaarddeviatie van de uitkomst. Bij een goed model is de RMSE kleiner.

Het unemployment-dataframe is alvast voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Bekijk de unemployment-data uit de vorige oefening.
  • Wijs voor het gemak de kolom residuals uit unemployment toe aan de variabele res.
  • Bereken de RMSE: kwadrateer res, neem daarvan het gemiddelde en neem vervolgens de wortel. Wijs dit toe aan de variabele rmse en print deze.
    • Tip: je kunt dit in één stap doen door de toewijzing tussen haakjes te zetten: (rmse <- ___)
  • Bereken de standaarddeviatie van female_unemployment en wijs deze toe aan de variabele sd_unemployment. Print deze. Hoe verhoudt de rmse van het model zich tot de standaarddeviatie van de data?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print a summary of unemployment
summary(unemployment)

# For convenience put the residuals in the variable res
res <- ___

# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)

# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)
Code bewerken en uitvoeren