MulaiMulai sekarang secara gratis

Melatih regresi logistik multivariabel

Dengan pengetahuan yang Anda peroleh dari video, Anda akan kembali ke himpunan data crab untuk melatih model regresi logistik multivariat. Pada bab 2 Anda telah melatih regresi logistik dengan width sebagai variabel penjelas. Dalam latihan ini Anda akan menganalisis dampak penambahan color sebagai variabel tambahan.

Variabel color memiliki urutan alami dari medium light, medium, medium dark, hingga dark. Dengan demikian color adalah variabel ordinal yang dalam contoh ini akan Anda perlakukan sebagai variabel kuantitatif.

Himpunan data crab sudah dimuat di workspace. Perhatikan juga bahwa satu-satunya perbedaan kode dari kasus univariat ada pada argumen formula, di mana sekarang Anda menambahkan struktur untuk memasukkan variabel baru.

Latihan ini adalah bagian dari kursus

Generalized Linear Models di Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi yang diperlukan dari pustaka statsmodels untuk GLM.
  • Tentukan argumen formula di mana width dan color adalah variabel penjelas dan y adalah respon.
  • Latih model regresi logistik multivariat menggunakan fungsi glm().
  • Cetak hasil model.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm

# Define model formula
formula = '____ ~ ____'

# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____

# Print model summary
____(____.____)
Edit dan Jalankan Kode