Model linear dan variabel respons biner
Dalam video, Anda melihat contoh pemasangan model linear pada variabel respons biner dan bagaimana hal tersebut dapat cepat menimbulkan masalah. Anda mempelajari bahwa, dengan garis linear terpasang, Anda dapat memperoleh nilai hasil prediksi \(\hat{y}\), yang tidak sejalan dengan logika permasalahan karena variabel respons hanya bernilai 0 dan 1.
Dengan menggunakan himpunan data crab yang sudah dimuat, Anda akan mempelajari efek ini dengan memodelkan y sebagai fungsi dari x menggunakan kerangka kerja GLM.
Ingat bahwa formulasi model GLM adalah:
glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()
di mana Anda menentukan formula, data, dan family.
Juga ingat bahwa GLM dengan:
- family Gaussian adalah model linear (kasus khusus dari GLM)
- family Binomial adalah model regresi logistik.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Petunjuk latihan
- Dengan menggunakan himpunan data
crab, tentukan formula model sehinggaydiprediksi olehwidth. - Untuk memasang model linear menggunakan formula GLM, gunakan
Gaussian()untuk argumen family yang mengasumsikan y bersifat kontinu dan berdistribusi normal secara aproksimatif. - Untuk memasang model logistik menggunakan formula GLM, gunakan
Binomial()untuk argumen family. - Pasang model menggunakan
glm()dengan argumen yang sesuai dan gunakanprint()sertasummary()untuk melihat ringkasan model yang dipasang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define model formula
formula = '____ ~ ____'
# Define probability distribution for the response variable for
# the linear (LM) and logistic (GLM) model
family_LM = sm.families.____
family_GLM = sm.families.____
# Define and fit a linear regression model
model_LM = glm(formula = ____, data = ____, family = ____).fit()
print(____.____)
# Define and fit a logistic regression model
model_GLM = glm(formula = ____, data = ____, family = ____).fit()
print(____.____)