Log-odds
Een nadeel van kansen (probabilities) en odds voor voorspellingen met logistische regressie is dat de voorspellingslijnen voor beide krom zijn. Daardoor is het lastiger te beredeneren wat er met de voorspelling gebeurt als je de verklarende variabele aanpast. De logaritme van de odds (de "log-odds" of "logit") heeft wél een lineaire relatie tussen de voorspelde respons en de verklarende variabele. Dat betekent dat wanneer de verklarende variabele verandert, je geen grote sprongen ziet in de responsmaat — alleen lineaire veranderingen.
Omdat de daadwerkelijke waarden van log-odds minder intuïtief zijn dan (lineaire) odds, is het voor visualisaties meestal beter om de odds te plotten en een log-transformatie op de y-as toe te passen.
mdl_churn_vs_relationship, explanatory_data en prediction_data zijn beschikbaar uit de vorige oefening.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Update prediction data with log_odds
____
# Print the head
print(____)