R carré
Précédemment, nous avons exprimé une autre mesure de qualité d’ajustement, le R carré (R-squared), comme un rapport entre la RSS et la VAR. En multipliant le numérateur et le dénominateur par 1/n, la forme numérique équivalente s’interprète comme le rapport entre la variance des résidus et la variance de la tendance linéaire dans les données que nous modélisons. On peut l’interpréter comme une mesure de la part de la variance de vos données « expliquée » par votre modèle, par opposition à la dispersion, ou variance, des résidus (après avoir retiré la tendance linéaire).
Ici, nous avons préchargé les données x_data, y_data et les prédictions du modèle y_model pour le meilleur ajustement ; votre objectif est de calculer la mesure R carré afin de quantifier dans quelle mesure ce modèle linéaire explique la variation des données.

Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Calculez les
residualsen soustrayanty_datadey_model, et lesdeviationsen soustrayanty_datade lanp.mean()dey_data. - Calculez la variance des
residualset la variance desdeviations, en appliquantnp.mean()etnp.square()à chacun. - Calculez
r_squaredcomme 1 moins le ratiovar_residuals / var_deviations, puis affichez le résultat.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the residuals and the deviations
residuals = ____ - y_data
deviations = np.____(____) - y_data
# Compute the variance of the residuals and deviations
var_residuals = np.____(np.____(____))
var_deviations = np.____(np.____(____))
# Compute r_squared as 1 - the ratio of RSS/Variance
r_squared = 1 - (____ / ____)
print('R-squared is {:0.2f}'.format(____))