Rapport de cotes logarithmique
Un inconvénient des probabilités et des rapports de cotes pour les prédictions de régression logistique est que les lignes de prédiction pour chacune d'entre elles sont courbes. Il est donc plus difficile de déterminer ce qui se passe au niveau de la prédiction lorsque vous modifiez la variable explicative. Le logarithme du rapport de cotes (le « log odds ratio ») présente une relation linéaire entre la réponse prédite et la variable explicative. Cela signifie que lorsque la variable explicative change, vous n'observez pas de changements significatifs dans l’indicateur de réponse, mais uniquement des changements linéaires.
Étant donné que les valeurs réelles du rapport de cotes logarithmique sont moins intuitives que celles du rapport de cotes (linéaire), il est généralement préférable, à des fins de visualisation, de représenter graphiquement le rapport de cotes et d'appliquer une transformation logarithmique à l'échelle de l'axe des y.
mdl_churn_vs_relationship``explanatory_data et plt_churn_vs_relationship sont disponibles et dplyr est chargé.
Cet exercice fait partie du cours
Introduction à la régression dans R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Update the data frame
prediction_data <- explanatory_data %>%
mutate(
has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
odds_ratio = has_churned / (1 - has_churned),
# Add the log odds ratio from odds_ratio
log_odds_ratio = ___,
# Add the log odds ratio using predict()
log_odds_ratio2 = ___
)
# See the result
prediction_data