Koefisien dalam bentuk odds
Sebelumnya Anda telah memasangkan model regresi logistik untuk probabilitas beralih sumur berdasarkan tingkat arsenic. Pada latihan ini, Anda akan melihat bagaimana variabel lain, distance100, berkaitan dengan probabilitas beralih serta menafsirkan nilai koefisien dalam bentuk odds.
Ingat bahwa model regresi logistik dinyatakan dalam log-odds, sehingga untuk memperoleh seberapa besar odds akan dikalikan ketika x naik satu satuan, Anda perlu mengeksponenkan taksiran koefisien. Ini juga disebut odds ratio.
Ingat bahwa odds adalah rasio antara kejadian terjadi dan kejadian tidak terjadi. Misalnya, jika odds untuk memenangkan sebuah permainan adalah 1/2 atau 1 banding 2 (1:2), artinya untuk setiap satu kemenangan terdapat 2 kekalahan.
Himpunan data wells sudah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Petunjuk latihan
- Impor pustaka
statsmodelsdan fungsiglmdaristatsmodels.formula.api. Impor juganumpysebagainp. - Dengan
glm(), pasangkan model regresi logistik di manaswitchdiprediksi olehdistance100. - Ekstrak koefisien model menggunakan
.params. - Hitung efek multiplikatif terhadap odds menggunakan fungsi
exp()darinumpy.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))