RMSE berekenen
In deze oefening bereken je de RMSE van je werkloosheidsmodel. In de vorige codeoefeningen
heb je twee kolommen toegevoegd aan de unemployment-gegevensset:
- de voorspellingen van het model (kolom
predictions) - de residualen tussen de voorspellingen en de uitkomst (kolom
residuals)
Je kunt de RMSE berekenen uit een vector met residualen, \(res\), als:
$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$
Je wilt dat de RMSE klein is. Hoe klein is "klein"? Een vuistregel is om de RMSE te vergelijken met de standaarddeviatie van de uitkomst. Bij een goed model is de RMSE kleiner.
Het unemployment-dataframe is alvast voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Bekijk de
unemployment-data uit de vorige oefening. - Wijs voor het gemak de kolom
residualsuitunemploymenttoe aan de variabeleres. - Bereken de RMSE: kwadrateer
res, neem daarvan het gemiddelde en neem vervolgens de wortel. Wijs dit toe aan de variabelermseen print deze.- Tip: je kunt dit in één stap doen door de toewijzing tussen haakjes te zetten:
(rmse <- ___)
- Tip: je kunt dit in één stap doen door de toewijzing tussen haakjes te zetten:
- Bereken de standaarddeviatie van
female_unemploymenten wijs deze toe aan de variabelesd_unemployment. Print deze. Hoe verhoudt de rmse van het model zich tot de standaarddeviatie van de data?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print a summary of unemployment
summary(unemployment)
# For convenience put the residuals in the variable res
res <- ___
# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)
# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)