MulaiMulai sekarang secara gratis

Model linear dan variabel respons biner

Dalam video, Anda melihat contoh pemasangan model linear pada variabel respons biner dan bagaimana hal tersebut dapat cepat menimbulkan masalah. Anda mempelajari bahwa, dengan garis linear terpasang, Anda dapat memperoleh nilai hasil prediksi \(\hat{y}\), yang tidak sejalan dengan logika permasalahan karena variabel respons hanya bernilai 0 dan 1.

Dengan menggunakan himpunan data crab yang sudah dimuat, Anda akan mempelajari efek ini dengan memodelkan y sebagai fungsi dari x menggunakan kerangka kerja GLM.

Ingat bahwa formulasi model GLM adalah:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

di mana Anda menentukan formula, data, dan family.

Juga ingat bahwa GLM dengan:

  • family Gaussian adalah model linear (kasus khusus dari GLM)
  • family Binomial adalah model regresi logistik.

Latihan ini adalah bagian dari kursus

Generalized Linear Models di Python

Lihat Kursus

Petunjuk latihan

  • Dengan menggunakan himpunan data crab, tentukan formula model sehingga y diprediksi oleh width.
  • Untuk memasang model linear menggunakan formula GLM, gunakan Gaussian() untuk argumen family yang mengasumsikan y bersifat kontinu dan berdistribusi normal secara aproksimatif.
  • Untuk memasang model logistik menggunakan formula GLM, gunakan Binomial() untuk argumen family.
  • Pasang model menggunakan glm() dengan argumen yang sesuai dan gunakan print() serta summary() untuk melihat ringkasan model yang dipasang.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define model formula
formula = '____ ~ ____'

# Define probability distribution for the response variable for 
# the linear (LM) and logistic (GLM) model
family_LM = sm.families.____
family_GLM = sm.families.____

# Define and fit a linear regression model
model_LM = glm(formula = ____, data = ____, family = ____).fit()
print(____.____)

# Define and fit a logistic regression model
model_GLM = glm(formula = ____, data = ____, family = ____).fit()
print(____.____)
Edit dan Jalankan Kode