Melatih regresi logistik multivariabel
Dengan pengetahuan yang Anda peroleh dari video, Anda akan kembali ke himpunan data crab untuk melatih model regresi logistik multivariat. Pada bab 2 Anda telah melatih regresi logistik dengan width sebagai variabel penjelas. Dalam latihan ini Anda akan menganalisis dampak penambahan color sebagai variabel tambahan.
Variabel color memiliki urutan alami dari medium light, medium, medium dark, hingga dark. Dengan demikian color adalah variabel ordinal yang dalam contoh ini akan Anda perlakukan sebagai variabel kuantitatif.
Himpunan data crab sudah dimuat di workspace. Perhatikan juga bahwa satu-satunya perbedaan kode dari kasus univariat ada pada argumen formula, di mana sekarang Anda menambahkan struktur untuk memasukkan variabel baru.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Petunjuk latihan
- Impor fungsi yang diperlukan dari pustaka
statsmodelsuntuk GLM. - Tentukan argumen
formuladi manawidthdancoloradalah variabel penjelas danyadalah respon. - Latih model regresi logistik multivariat menggunakan fungsi
glm(). - Cetak hasil model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)