Bir eşik değeri (cut-off) belirtmek
Bir eşik değeri belirlemenin, iyi bir karmaşıklık matrisi elde etmede nasıl fark yaratabileceğini gösterdik. Şimdi, tahmin vektörünü kredinin durumunu gösteren ikili değerlere dönüştürmeyi öğreneceksin. R'deki ifelse() fonksiyonu burada işine yarar.
Bir cut-off bağlamında ifelse() fonksiyonunu uyguladığında şöyle bir şey elde edersin:
ifelse(predictions > 0.3, 1, 0)
İlk argümanda, tahminler vektöründeki belirli bir değerin 0.3'ten büyük olup olmadığını test ediyorsun. Bu TRUE ise R "1" döndürür (ikinci argümanda belirtilen), FALSE ise R "0" döndürür (üçüncü argümanda belirtilen). Bunlar sırasıyla "temerrüt" ve "temerrüt yok"u temsil eder.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Tam lojistik regresyon modelinin kodu ve tahminler vektörü konsolunda verilmiştir.
- 0.15 eşik değeri kullanarak,
ifelse()fonksiyonunu vepredictions_all_full'u kullanıppred_cutoff_15vektörünü oluştur. table()ile karmaşıklık matrisine bak (ilk argümana gerçek değerleri, yanitest_set$loan_status'ı gir).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# The code for the logistic regression model and the predictions is given below
log_model_full <- glm(loan_status ~ ., family = "binomial", data = training_set)
predictions_all_full <- predict(log_model_full, newdata = test_set, type = "response")
# Make a binary predictions-vector using a cut-off of 15%
# Construct a confusion matrix