Vorhersagen für die Testdaten
In der vorigen Übung schienen die lineare Regression und Ridge zu ähnlichen Ergebnissen zu führen. Somit könnten beide Modelle für die Aufgabe genutzt werden. Du kannst jedoch die Vorhersageleistung anhand der Testdaten prüfen, um zu sehen, ob doch eines der beiden Modelle das andere übertrifft.
Dazu berechnest du die Wurzel des mittleren quadratischen Fehlers (Root Mean Squared Error, kurz: RMSE). Das Dictionary models
enthält die Namen und Instanzen der beiden Modelle und wurde zusammen mit den Trainings- und Zielarrays X_train_scaled
, X_test_scaled
, y_train
und y_test
bereits geladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
root_mean_squared_error
. - Passe das Modell an die skalierten Trainingsmerkmale und die Trainingslabels an.
- Erstelle anhand der skalierten Testmerkmale die Vorhersagen.
- Berechne den RMSE-Wert, indem du die Labels der Testmenge und die vorhergesagten Labels an die entsprechende Funktion übergibst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import root_mean_squared_error
from ____.____ import ____
for name, model in models.items():
# Fit the model to the training data
____
# Make predictions on the test set
y_pred = ____
# Calculate the test_rmse
test_rmse = ____(____, ____)
print("{} Test Set RMSE: {}".format(name, test_rmse))