De beste adjusted R-squared vergelijken en kiezen

Bij de analyse van geïmputeerde DataFrames met een lineair model geeft de adjusted R-squared (\(adj.R^2\)) aan welk model het best past.

In deze oefening vergelijk je de \(adj.R^2\)-scores van de lineaire modellen (voor elk van de eerder door jou geïmputeerde datasets), namelijk lm_mean, lm_KNN en lm_MICE.

Je drukt eerst netjes (door een DataFrame te maken) hun attribuut rsquared_adj af en kiest daarna het model met de hoogste \(adj.R^2\).

De bovenstaande modellen zijn al voor je geladen als lm_mean, lm_KNN en lm_MICE.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Store the Adj. R-squared scores of the linear models
rsquared_df = pd.DataFrame({'Mean Imputation': ___, 
                          'KNN Imputation': ___, 
                          'MICE Imputation': ___}, 
                         index=['Adj. R-squared'])

# Neatly print the Adj. R-squared scores in the console
print(rsquared_df)

Code bewerken en uitvoeren