Comparer et choisir le meilleur R-carré ajusté

Lors de l’analyse de DataFrames imputés avec un modèle linéaire, le score de R-carré ajusté (\(adj.R^2\)) permet d’identifier le modèle le mieux ajusté.

Dans cet exercice, vous allez comparer les scores \(adj.R^2\) des modèles linéaires (pour chacun des jeux de données imputés) que vous avez créés plus tôt : lm_mean, lm_KNN et lm_MICE.

Vous allez d’abord afficher proprement (en créant un DataFrame) leur attribut rsquared_adj, puis choisir le modèle avec le \(adj.R^2\) maximal.

Les modèles ci-dessus ont déjà été chargés pour vous sous les noms lm_mean, lm_KNN et lm_MICE.

Cet exercice fait partie du cours

<cours>Gérer les données manquantes en Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Store the Adj. R-squared scores of the linear models
rsquared_df = pd.DataFrame({'Mean Imputation': ___, 
                          'KNN Imputation': ___, 
                          'MICE Imputation': ___}, 
                         index=['Adj. R-squared'])

# Neatly print the Adj. R-squared scores in the console
print(rsquared_df)

Modifier et exécuter le code