Log-Odds Ratio
Ein Nachteil von Wahrscheinlichkeiten und Odds Ratios bei Vorhersagen aus der logistischen Regression ist, dass die Vorhersagelinien in beiden Fällen gekrümmt sind. Das erschwert es, nachzuvollziehen, was mit der Vorhersage passiert, wenn du die erklärende Variable änderst. Der Logarithmus der Odds Ratio (die „Log-Odds Ratio“) hat hingegen eine lineare Beziehung zwischen vorhergesagter Antwort und erklärender Variable. Das bedeutet: Wenn sich die erklärende Variable ändert, siehst du keine dramatischen Sprünge in der Zielgröße – nur lineare Veränderungen.
Da die tatsächlichen Werte der Log-Odds Ratio weniger intuitiv sind als die (lineare) Odds Ratio, ist es für die Visualisierung meist besser, die Odds Ratio zu plotten und eine log-Transformation auf die y-Achse anzuwenden.
mdl_churn_vs_relationship, explanatory_data und plt_churn_vs_relationship sind verfügbar und dplyr ist geladen.
Diese Übung ist Teil des Kurses
Einführung in Regression mit R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Update the data frame
prediction_data <- explanatory_data %>%
mutate(
has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
odds_ratio = has_churned / (1 - has_churned),
# Add the log odds ratio from odds_ratio
log_odds_ratio = ___,
# Add the log odds ratio using predict()
log_odds_ratio2 = ___
)
# See the result
prediction_data