Log olasılık oranı
Lojistik regresyon tahminleri için olasılıklar ve olasılık oranlarının bir dezavantajı, her ikisi için de tahmin eğrilerinin kavisli olmasıdır. Bu da, açıklayıcı değişkende bir değişiklik yaptığında tahminin nasıl etkileneceğini kavramayı zorlaştırır. Olasılık oranının logaritması ("log olasılık oranı"), tahmin edilen yanıt ile açıklayıcı değişken arasında doğrusal bir ilişkiye sahiptir. Yani açıklayıcı değişken değiştikçe, yanıt metriğinde dramatik sıçramalar değil, doğrusal değişimler görürsün.
Log olasılık oranının gerçek değerleri (doğrusal) olasılık oranına göre daha az sezgisel olduğundan, görselleştirme amacıyla genellikle olasılık oranını çizmek ve y-ekseni ölçeğine log dönüşümü uygulamak daha iyidir.
mdl_churn_vs_relationship, explanatory_data ve plt_churn_vs_relationship hazır, ayrıca dplyr yüklü.
Bu egzersiz
R'da Regresyona Giriş
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Update the data frame
prediction_data <- explanatory_data %>%
mutate(
has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
odds_ratio = has_churned / (1 - has_churned),
# Add the log odds ratio from odds_ratio
log_odds_ratio = ___,
# Add the log odds ratio using predict()
log_odds_ratio2 = ___
)
# See the result
prediction_data