Voorspellen op de testset
In de vorige oefening leken lineaire regressie en ridge vergelijkbare resultaten op te leveren. Het is prima om een van deze modellen te kiezen; je kunt echter de voorspellende prestaties op de testset controleren om te zien of een van beide het beter doet dan de ander.
Je gebruikt root mean squared error (RMSE) als metriek. De dictionary models, met de namen en instanties van de twee modellen, is alvast voor je ingeladen, samen met de train- en doelarrays X_train_scaled, X_test_scaled, y_train en y_test.
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Oefeninstructies
- Importeer
root_mean_squared_error. - Fit het model op de geschaalde trainingsfeatures en de trainingslabels.
- Maak voorspellingen met de geschaalde testfeatures.
- Bereken de RMSE door de testsetlabels en de voorspelde labels door te geven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import root_mean_squared_error
from ____.____ import ____
for name, model in models.items():
# Fit the model to the training data
____
# Make predictions on the test set
y_pred = ____
# Calculate the test_rmse
test_rmse = ____(____, ____)
print("{} Test Set RMSE: {}".format(name, test_rmse))