Prédiction sur l'ensemble de test
Dans le dernier exercice, la régression linéaire et la crête semblent produire des résultats similaires. Il serait approprié de sélectionner l'un ou l'autre de ces modèles ; cependant, vous pouvez vérifier la performance prédictive sur l'ensemble de test pour voir si l'un ou l'autre peut être plus performant que l'autre.
Vous utiliserez l'erreur quadratique moyenne (RMSE) comme mesure. Le dictionnaire models
, qui contient les noms et les instances des deux modèles, a été préchargé pour vous, ainsi que les tableaux d'apprentissage et d'objectifs X_train_scaled
, X_test_scaled
, y_train
et y_test
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions d’exercice
- Importer
mean_squared_error
. - Ajustez le modèle aux caractéristiques d'apprentissage mises à l'échelle et aux étiquettes d'apprentissage.
- Faites des prédictions en utilisant les caractéristiques du test mises à l'échelle.
- Calculez le RMSE en passant les étiquettes de l'ensemble de test et les étiquettes prédites.
Exercice interactif pratique
Essayez-vous à cet exercice en complétant cet exemple de code.
# Import mean_squared_error
from ____.____ import ____
for name, model in models.items():
# Fit the model to the training data
____
# Make predictions on the test set
y_pred = ____
# Calculate the test_rmse
test_rmse = ____(____, ____, squared=____)
print("{} Test Set RMSE: {}".format(name, test_rmse))