De beste adjusted R-squared vergelijken en kiezen
Bij de analyse van geïmputeerde DataFrames met een lineair model geeft de adjusted R-squared (\(adj.R^2\)) aan welk model het best past.
In deze oefening vergelijk je de \(adj.R^2\)-scores van de lineaire modellen (voor elk van de eerder door jou geïmputeerde datasets), namelijk lm_mean, lm_KNN en lm_MICE.
Je drukt eerst netjes (door een DataFrame te maken) hun attribuut rsquared_adj af en kiest daarna het model met de hoogste \(adj.R^2\).
De bovenstaande modellen zijn al voor je geladen als lm_mean, lm_KNN en lm_MICE.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Store the Adj. R-squared scores of the linear models
rsquared_df = pd.DataFrame({'Mean Imputation': ___,
'KNN Imputation': ___,
'MICE Imputation': ___},
index=['Adj. R-squared'])
# Neatly print the Adj. R-squared scores in the console
print(rsquared_df)