Log-cotes
L’un des inconvénients des probabilités et des cotes pour les prédictions en régression logistique est que les courbes de prédiction sont incurvées. Il est donc plus difficile de comprendre ce qui arrive à la prédiction lorsque vous modifiez la variable explicative. Le logarithme des cotes (les « log-cotes » ou le « logit ») présente en revanche une relation linéaire entre la réponse prédite et la variable explicative. Cela signifie qu’à mesure que la variable explicative évolue, vous n’observez pas de changements brusques dans la mesure de réponse, mais uniquement des variations linéaires.
Comme les valeurs de log-cotes sont moins intuitives que les cotes (linéaires), pour la visualisation il est généralement préférable de tracer les cotes et d’appliquer une transformation logarithmique à l’échelle de l’axe des ordonnées.
mdl_churn_vs_relationship, explanatory_data et prediction_data sont disponibles depuis l’exercice précédent.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Update prediction data with log_odds
____
# Print the head
print(____)