Évaluer l’ajustement du modèle

Vous allez maintenant mesurer les performances de la régression sur les données d’entraînement et de test à l’aide de deux métriques : la racine de l’erreur quadratique moyenne (RMSE) et l’erreur absolue moyenne (MAE). C’est une étape essentielle qui permet de voir à quel point les prédictions du modèle sont « proches » des valeurs réelles.

La bibliothèque numpy a été importée sous le nom np. Les fonctions mean_absolute_error et mean_squared_error ont été chargées. Les variables cibles d’entraînement et de test sont disponibles sous train_Y et test_Y, et les valeurs prédites d’entraînement et de test sont respectivement importées sous train_pred_Y et test_pred_Y.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

Calculez la racine de l’erreur quadratique moyenne sur les données d’entraînement en utilisant la fonction np.sqrt().
Calculez l’erreur absolue moyenne sur les données d’entraînement.
Calculez la racine de l’erreur quadratique moyenne sur les données de test.
Calculez l’erreur absolue moyenne sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate root mean squared error on training data
rmse_train = np.sqrt(___(train_Y, train_pred_Y))

# Calculate mean absolute error on training data
mae_train = ___(train_Y, train_pred_Y)

# Calculate root mean squared error on testing data
rmse_test = np.sqrt(___(test_Y, test_pred_Y))

# Calculate mean absolute error on testing data
mae_test = ___(test_Y, test_pred_Y)

# Print the performance metrics
print('RMSE train: {}; RMSE test: {}\nMAE train: {}, MAE test: {}'.format(rmse_train, rmse_test, mae_train, mae_test))

Modifier et exécuter le code