Regresi logistik dasar
Dalam video, Anda melihat model regresi logistik yang memasukkan variabel age sebagai prediktor. Sekarang, Anda akan memasukkan variabel kategorikal dan mempelajari cara menafsirkan taksiran parameternya.
Saat Anda memasukkan variabel kategorikal dalam model regresi logistik di R, Anda akan memperoleh taksiran parameter untuk semua kategorinya kecuali satu. Kategori yang tidak diberi taksiran parameter ini disebut kategori referensi. Parameter untuk setiap kategori lainnya merepresentasikan odds ratio yang mendukung terjadinya gagal bayar pinjaman antara kategori yang diminati dan kategori referensi. Jangan khawatir jika ini belum sepenuhnya jelas bagi Anda; Anda akan mengerjakan lebih banyak latihan tentang hal ini nanti!
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Bangun model regresi logistik bernama
log_model_catdengan variabel kategorikalir_catsebagai satu-satunya prediktor. Pemanggilan glm() Anda harus berisi tiga argumen: loan_status ~ ir_catfamily = "binomial"data = training_set- Lihat hasilnya di konsol untuk melihat taksiran parameter Anda.
- Cari tahu apa kategori referensinya dengan melihat kembali struktur
ir_cat(dalam himpunan data lengkaploan_data). Gunakan fungsitable()untuk melakukannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()