Temel lojistik regresyon
Videoda, yordayıcı olarak age değişkenini içeren bir lojistik regresyon modeline baktın. Şimdi kategorik bir değişken ekleyecek ve onun parametre tahminlerini nasıl yorumlayacağını öğreneceksin.
R'de bir lojistik regresyon modeline kategorik bir değişken eklediğinde, kategorilerin tümü için (bir tanesi hariç) birer parametre tahmini elde edersin. Parametre tahmini verilmeyen bu kategoriye referans kategori denir. Diğer her kategori için verilen parametre, ilgili kategori ile referans kategori arasındaki kredi temerrüdü lehine olasılık oranını temsil eder. Şimdilik tam olarak net değilse endişe etme; ileride bununla ilgili daha çok egzersiz yapacaksın!
Bu egzersiz, kursun bir parçasıdır
R ile Kredi Riski Modellemesi
Egzersiz talimatları
ir_catadlı kategorik değişkeni tek yordayıcı olarak kullananlog_model_catisimli bir lojistik regresyon modeli kur. glm() çağrında üç argüman olmalı:loan_status ~ ir_catfamily = "binomial"data = training_set- Parametre tahminlerini görmek için sonucu konsolda görüntüle.
- Referans kategorinin ne olduğunu,
ir_catdeğişkeninin yapısına (tam veri kümesiloan_dataiçinde) tekrar bakarak bul. Bunu yapmak içintable()fonksiyonunu kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()