Analisis ringkasan model linear
Menganalisis kinerja berbagai model imputasi adalah salah satu tugas terpenting saat menangani data hilang. Hal ini menentukan jenis DataFrame hasil imputasi yang dapat Anda andalkan. Untuk analisis, Anda dapat menyesuaikan model regresi linear pada DataFrame hasil imputasi dan memeriksa berbagai parameter yang memengaruhi pemilihan jenis imputasi.
Dalam latihan ini, Anda sudah dimuatkan DataFrame diabetes_cc yang merupakan complete case dari DataFrame diabetes. Complete case bertindak sebagai dasar perbandingan terhadap DataFrame hasil imputasi lainnya. Anda akan menggunakan paket statsmodels.api yang dimuat sebagai sm untuk membuat model regresi linear dan menghasilkan ringkasan.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Add constant to X and set X & y values to fit linear model
X = sm.add_constant(___)
y = ___
lm = sm.OLS(y, X).fit()