Temel lojistik regresyon
Videoda, yordayıcı olarak age değişkenini içeren bir lojistik regresyon modeline baktın. Şimdi kategorik bir değişken ekleyecek ve onun parametre tahminlerini nasıl yorumlayacağını öğreneceksin.
R'de bir lojistik regresyon modeline kategorik bir değişken eklediğinde, kategorilerin tümü için (bir tanesi hariç) birer parametre tahmini elde edersin. Parametre tahmini verilmeyen bu kategoriye referans kategori denir. Diğer her kategori için verilen parametre, ilgili kategori ile referans kategori arasındaki kredi temerrüdü lehine olasılık oranını temsil eder. Şimdilik tam olarak net değilse endişe etme; ileride bununla ilgili daha çok egzersiz yapacaksın!
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
ir_catadlı kategorik değişkeni tek yordayıcı olarak kullananlog_model_catisimli bir lojistik regresyon modeli kur. glm() çağrında üç argüman olmalı:loan_status ~ ir_catfamily = "binomial"data = training_set- Parametre tahminlerini görmek için sonucu konsolda görüntüle.
- Referans kategorinin ne olduğunu,
ir_catdeğişkeninin yapısına (tam veri kümesiloan_dataiçinde) tekrar bakarak bul. Bunu yapmak içintable()fonksiyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()