Comparer et choisir le meilleur R-carré ajusté
Lors de l’analyse de DataFrames imputés avec un modèle linéaire, le score de R-carré ajusté (\(adj.R^2\)) permet d’identifier le modèle le mieux ajusté.
Dans cet exercice, vous allez comparer les scores \(adj.R^2\) des modèles linéaires (pour chacun des jeux de données imputés) que vous avez créés plus tôt : lm_mean, lm_KNN et lm_MICE.
Vous allez d’abord afficher proprement (en créant un DataFrame) leur attribut rsquared_adj, puis choisir le modèle avec le \(adj.R^2\) maximal.
Les modèles ci-dessus ont déjà été chargés pour vous sous les noms lm_mean, lm_KNN et lm_MICE.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Store the Adj. R-squared scores of the linear models
rsquared_df = pd.DataFrame({'Mean Imputation': ___,
'KNN Imputation': ___,
'MICE Imputation': ___},
index=['Adj. R-squared'])
# Neatly print the Adj. R-squared scores in the console
print(rsquared_df)