BaşlayınÜcretsiz Başlayın

Bir lojistik regresyon modelinde birden çok değişken

Bir modelde birden fazla değişken yer alsa da tek bir parametrenin yorumu geçerliliğini korur. Bir değişkende bir değişim olduğunda yorum istenirken, diğer değişkenlerin sabit, yani değişmeden kaldığı varsayılır. Buna süslü bir Latince ifade olan ceteris paribus denir; kelimenin tam anlamıyla “diğer her şey aynı kalırken” demektir.

Birden çok değişkenli bir lojistik regresyon modeli kurmak için değişken eklemek üzere + işaretini kullanabilirsin. Formülün şu şekilde olur:

y ~ x1 + ... + xk

Modeli değerlendirirken dikkat edilmesi gereken birkaç nokta vardır. Parametre değerlerine zaten baktın, ancak önemli olan tek şey bu değil. Bir parametre tahmininin istatistiksel anlamlılığı da önemlidir. Bir parametrenin anlamlılığına genellikle p-değeri denir; ancak model çıktısında Pr(>|t|) olarak görürsün. glm’de zayıf anlamlılık "." ile, çok güçlü anlamlılık ise "***" ile gösterilir. Bir parametre anlamlı değilse, bu parametrenin 0’dan istatistiksel olarak farklı olduğunu güvenle söyleyemezsin. İstatistiksel anlamlılık önemlidir. Genel olarak, temerrüt üzerindeki etkiyi sadece anlamlı parametreler için yorumlamak mantıklıdır.

Bu egzersiz

R ile Kredi Riski Modellemesi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • glm() fonksiyonunu ve training_set veri kümesini kullanarak bir lojistik regresyon modeli oluştur. age, ir_cat, grade, loan_amnt ve annual_inc değişkenlerini dahil et. Bu modele log_model_multi adını ver.
  • Anlamlılık düzeylerini, modelimizle birlikte summary() kullanarak elde et. Anlamlılık düzeylerinin ne ifade ettiğine bir sonraki egzersizde daha ayrıntılı bakacaksın!

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Build the logistic regression model



# Obtain significance levels using summary()
Kodu Düzenle ve Çalıştır