Mean squared error
Kijk nog eens naar de NBA-voorspellingen van 2017. Elk jaar zijn er wel een paar NBA-teams die véél meer wedstrijden winnen dan verwacht. Als je de MAE gebruikt, straft deze nauwkeurigheidsmaat slechte voorspellingen minder hard dan wanneer je de MSE gebruikt. Door grote fouten te kwadrateren, lijken de resultaten minder goed.
In dit voorbeeld willen NBA-bestuurders het aantal overwinningen per team beter voorspellen. Je gebruikt de mean squared error om de voorspellingsfout te berekenen. De werkelijke overwinningen staan in y_test en de voorspellingen in predictions.
Deze oefening maakt deel uit van de cursus
Modelvalidatie in Python
Oefeninstructies
- Bereken de MSE handmatig. $$ MSE = \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i ) ^2 }{n} $$
- Bereken de MSE met
sklearn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from sklearn.metrics import ____
n = ___(predictions)
# Finish the manual calculation of the MSE
mse_one = sum((y_test - predictions)____) / n
print('With a manual calculation, the error is {}'.format(mse_one))
# Use the scikit-learn function to calculate MSE
mse_two = ____
print('Using scikit-learn, the error is {}'.format(mse_two))