Aan de slagGa gratis aan de slag

Log-odds

Een nadeel van kansen (probabilities) en odds voor voorspellingen met logistische regressie is dat de voorspellingslijnen voor beide krom zijn. Daardoor is het lastiger te beredeneren wat er met de voorspelling gebeurt als je de verklarende variabele aanpast. De logaritme van de odds (de "log-odds" of "logit") heeft wél een lineaire relatie tussen de voorspelde respons en de verklarende variabele. Dat betekent dat wanneer de verklarende variabele verandert, je geen grote sprongen ziet in de responsmaat — alleen lineaire veranderingen.

Omdat de daadwerkelijke waarden van log-odds minder intuïtief zijn dan (lineaire) odds, is het voor visualisaties meestal beter om de odds te plotten en een log-transformatie op de y-as toe te passen.

mdl_churn_vs_relationship, explanatory_data en prediction_data zijn beschikbaar uit de vorige oefening.

Deze oefening maakt deel uit van de cursus

Introductie tot regressie met statsmodels in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Update prediction data with log_odds
____

# Print the head
print(____)
Code bewerken en uitvoeren