Membandingkan dan memilih adjusted R-squared terbaik
Selama analisis DataFrame yang diimputasi pada sebuah model linear, skor adjusted R-squared (\(adj.R^2\)) menjelaskan model dengan kecocokan terbaik.
Dalam latihan ini, Anda akan membandingkan skor \(adj.R^2\) dari model linear (untuk setiap himpunan data yang telah diimputasi) yang Anda buat sebelumnya, yaitu lm_mean, lm_KNN, dan lm_MICE.
Pertama, Anda akan menampilkan dengan rapi (dengan membuat sebuah DataFrame) atribut rsquared_adj mereka dan akhirnya memilih model dengan \(adj.R^2\) maksimum.
Model di atas telah dimuat untuk Anda sebagai lm_mean, lm_KNN, dan lm_MICE.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Store the Adj. R-squared scores of the linear models
rsquared_df = pd.DataFrame({'Mean Imputation': ___,
'KNN Imputation': ___,
'MICE Imputation': ___},
index=['Adj. R-squared'])
# Neatly print the Adj. R-squared scores in the console
print(rsquared_df)