CommencerCommencer gratuitement

Plus l’erreur est grande, plus la pénalité est forte

Toutes les erreurs comptent, mais elles ne se valent pas toutes. Parfois, de grandes erreurs de prédiction sont disproportionnellement plus dommageables que les petites.

Plus l’erreur est grande, plus la pénalité est forte : c’est l’une des caractéristiques du RMSE (root mean squared error). Il met au carré les grandes erreurs, ce qui pénalise davantage ces valeurs aberrantes que les erreurs plus faibles.

Le RMSE se calcule à l’aide de la formule suivante, où la squared_diff i-ième est le carré de l’erreur i-ième.

$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$

Dans cet exercice, vous allez calculer le RMSE de vos prédictions.

Votre espace de travail contient le résultat du dernier exercice, test_enriched, les données de test avec une nouvelle colonne .pred, qui correspond aux prédictions hors échantillon du modèle.

Cet exercice fait partie du cours

Machine Learning avec des modèles à base d’arbres en R

Afficher le cours

Instructions

  • Calculez, élément par élément, les différences entre les prédictions et les notes finales, mettez-les au carré et enregistrez-les dans squared_diffs.
  • Utilisez la formule ci-dessus pour calculer le RMSE et enregistrez-le dans rmse_manual.
  • Utilisez la fonction rmse() pour calculer l’erreur et enregistrez le résultat dans rmse_auto.
  • Affichez rmse_manual et rmse_auto pour vérifier qu’ils sont identiques.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the squared differences
squared_diffs <- (___ - ___)^___

# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)

# Compute the RMSE using a function
rmse_auto <- ___(___,
                 ___,
                 ___)

# Print both errors
___
___
Modifier et exécuter le code