Jelajahi koefisien model
Sekarang Anda akan menilai kinerja model dari sudut pandang yang berbeda, dan hanya pada data pelatihan. Salah satu hal yang Anda pelajari di pelajaran terakhir adalah bahwa tidak semua koefisien model signifikan secara statistik, dan kita perlu melihat tabel ringkasan model untuk menilai signifikansinya. Untungnya, pustaka statsmodels menyediakan fungsionalitas ini. Setelah Anda mencetak tabel ringkasan model, telusuri variabel mana yang memiliki nilai p lebih rendah dari 0,05 (yakni lebih rendah dari 5%) untuk memastikan koefisiennya signifikan.
Fitur pelatihan dimuat sebagai train_X, dan variabel target sebagai train_Y yang telah dikonversi menjadi array numpy.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Impor modul
statsmodels.api. - Inisialisasi instance model pada data pelatihan menggunakan fungsi
OLS(). - Latih model.
- Cetak ringkasan model menggunakan metode
.summary().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import `statsmodels.api` module
import ___.___ as sm
# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)
# Fit the model
olsreg = olsreg.___()
# Print model summary
print(olsreg.___())