Log odds ratio
Salah satu kekurangan probabilitas dan odds ratio untuk prediksi regresi logistik adalah garis prediksinya melengkung. Ini membuatnya lebih sulit untuk menalar apa yang terjadi pada prediksi ketika Anda mengubah variabel penjelas. Logaritma dari odds ratio ("log odds ratio") memiliki hubungan linear antara respons yang diprediksi dan variabel penjelas. Artinya, saat variabel penjelas berubah, Anda tidak akan melihat perubahan dramatis pada metrik respons—hanya perubahan linear.
Karena nilai aktual log odds ratio kurang intuitif dibandingkan odds ratio (linear), untuk tujuan visualisasi biasanya lebih baik memplot odds ratio dan menerapkan transformasi log pada skala sumbu y.
mdl_churn_vs_relationship, explanatory_data, dan plt_churn_vs_relationship tersedia dan dplyr telah dimuat.
Latihan ini adalah bagian dari kursus
Pengantar Regresi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Update the data frame
prediction_data <- explanatory_data %>%
mutate(
has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
odds_ratio = has_churned / (1 - has_churned),
# Add the log odds ratio from odds_ratio
log_odds_ratio = ___,
# Add the log odds ratio using predict()
log_odds_ratio2 = ___
)
# See the result
prediction_data