Vorhersage für die Testmenge
In der letzten Übung schienen lineare Regression und Ridge zu ähnlichen Ergebnissen zu führen. Es wäre sinnvoll, eines der beiden Modelle zu wählen. Du kannst jedoch die Vorhersageleistung mit der Testmenge prüfen, um zu sehen, ob eines der beiden Modelle das andere übertreffen kann.
Du wirst die Quadratwurzel des mittleren quadratischen Fehlers (RMSE) als Kennzahl verwenden. Das Dictionary models
, das die Namen und Instanzen der beiden Modelle enthält, wurde zusammen mit den Trainings- und Zielarrays X_train_scaled
, X_test_scaled
, y_train
und y_test
für dich vorgeladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
mean_squared_error
. - Passe das Modell an die skalierten Trainingsmerkmale und die Trainingslabels an.
- Mache Vorhersagen anhand der skalierten Testmerkmale.
- Berechne den RMSE, indem du die Labels der Testmenge und die vorhergesagten Labels übergibst.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import mean_squared_error
from ____.____ import ____
for name, model in models.items():
# Fit the model to the training data
____
# Make predictions on the test set
y_pred = ____
# Calculate the test_rmse
test_rmse = ____(____, ____, squared=____)
print("{} Test Set RMSE: {}".format(name, test_rmse))