Évaluer l’ajustement du modèle
Vous allez maintenant mesurer les performances de la régression sur les données d’entraînement et de test à l’aide de deux métriques : la racine de l’erreur quadratique moyenne (RMSE) et l’erreur absolue moyenne (MAE). C’est une étape essentielle qui permet de voir à quel point les prédictions du modèle sont « proches » des valeurs réelles.
La bibliothèque numpy a été importée sous le nom np. Les fonctions mean_absolute_error et mean_squared_error ont été chargées. Les variables cibles d’entraînement et de test sont disponibles sous train_Y et test_Y, et les valeurs prédites d’entraînement et de test sont respectivement importées sous train_pred_Y et test_pred_Y.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Calculez la racine de l’erreur quadratique moyenne sur les données d’entraînement en utilisant la fonction
np.sqrt(). - Calculez l’erreur absolue moyenne sur les données d’entraînement.
- Calculez la racine de l’erreur quadratique moyenne sur les données de test.
- Calculez l’erreur absolue moyenne sur les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate root mean squared error on training data
rmse_train = np.sqrt(___(train_Y, train_pred_Y))
# Calculate mean absolute error on training data
mae_train = ___(train_Y, train_pred_Y)
# Calculate root mean squared error on testing data
rmse_test = np.sqrt(___(test_Y, test_pred_Y))
# Calculate mean absolute error on testing data
mae_test = ___(test_Y, test_pred_Y)
# Print the performance metrics
print('RMSE train: {}; RMSE test: {}\nMAE train: {}, MAE test: {}'.format(rmse_train, rmse_test, mae_train, mae_test))