Spesifikasi dan estimasi model
Anda telah melihat perintah glm() untuk menjalankan regresi logistik. glm() adalah singkatan dari generalized linear model dan menyediakan seluruh keluarga model regresi.
Gunakan himpunan data latihan untuk tugas pemrograman ini. Data defaultData yang Anda perlukan untuk latihan ini sudah tersedia di lingkungan Anda dan siap untuk pemodelan.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Petunjuk latihan
- Gunakan fungsi
glm()untuk memodelkan probabilitas bahwa seorang pelanggan gagal membayar dengan menggunakan regresi logistik. Sertakan semua variabel penjelas dalam himpunan data dan tentukan data yang akan digunakan. - Jangan lupa menentukan argumen
family. - Ekstrak koefisien dari model, lalu ubah menjadi odds ratio dan bulatkan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp