CommencerCommencer gratuitement

R carré

Précédemment, nous avons exprimé une autre mesure de qualité d’ajustement, le R carré (R-squared), comme un rapport entre la RSS et la VAR. En multipliant le numérateur et le dénominateur par 1/n, la forme numérique équivalente s’interprète comme le rapport entre la variance des résidus et la variance de la tendance linéaire dans les données que nous modélisons. On peut l’interpréter comme une mesure de la part de la variance de vos données « expliquée » par votre modèle, par opposition à la dispersion, ou variance, des résidus (après avoir retiré la tendance linéaire).

Ici, nous avons préchargé les données x_data, y_data et les prédictions du modèle y_model pour le meilleur ajustement ; votre objectif est de calculer la mesure R carré afin de quantifier dans quelle mesure ce modèle linéaire explique la variation des données.

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Calculez les residuals en soustrayant y_data de y_model, et les deviations en soustrayant y_data de la np.mean() de y_data.
  • Calculez la variance des residuals et la variance des deviations, en appliquant np.mean() et np.square() à chacun.
  • Calculez r_squared comme 1 moins le ratio var_residuals / var_deviations, puis affichez le résultat.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the residuals and the deviations
residuals = ____ - y_data
deviations = np.____(____) - y_data

# Compute the variance of the residuals and deviations
var_residuals = np.____(np.____(____))
var_deviations = np.____(np.____(____))

# Compute r_squared as 1 - the ratio of RSS/Variance
r_squared = 1 - (____ / ____)
print('R-squared is {:0.2f}'.format(____))
Modifier et exécuter le code