MulaiMulai sekarang secara gratis

Regresi logistik dasar

Dalam video, Anda melihat model regresi logistik yang memasukkan variabel age sebagai prediktor. Sekarang, Anda akan memasukkan variabel kategorikal dan mempelajari cara menafsirkan taksiran parameternya.

Saat Anda memasukkan variabel kategorikal dalam model regresi logistik di R, Anda akan memperoleh taksiran parameter untuk semua kategorinya kecuali satu. Kategori yang tidak diberi taksiran parameter ini disebut kategori referensi. Parameter untuk setiap kategori lainnya merepresentasikan odds ratio yang mendukung terjadinya gagal bayar pinjaman antara kategori yang diminati dan kategori referensi. Jangan khawatir jika ini belum sepenuhnya jelas bagi Anda; Anda akan mengerjakan lebih banyak latihan tentang hal ini nanti!

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Bangun model regresi logistik bernama log_model_cat dengan variabel kategorikal ir_cat sebagai satu-satunya prediktor. Pemanggilan glm() Anda harus berisi tiga argumen:
  • loan_status ~ ir_cat
  • family = "binomial"
  • data = training_set
  • Lihat hasilnya di konsol untuk melihat taksiran parameter Anda.
  • Cari tahu apa kategori referensinya dengan melihat kembali struktur ir_cat (dalam himpunan data lengkap loan_data). Gunakan fungsi table() untuk melakukannya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build a glm model with variable ir_cat as a predictor



# Print the parameter estimates 


# Look at the different categories in ir_cat using table()
Edit dan Jalankan Kode