Aan de slagGa gratis aan de slag

Log-oddsratio

Een nadeel van kansen (probabilities) en oddsratio’s voor voorspellingen met logistische regressie is dat de voorspellijnen gekromd zijn. Daardoor is het lastiger te redeneren wat er met de voorspelling gebeurt als je de verklarende variabele aanpast. Het logaritme van de oddsratio (de "log-oddsratio") heeft wél een lineair verband tussen de voorspelde respons en de verklarende variabele. Dat betekent dat wanneer de verklarende variabele verandert, je geen abrupte veranderingen in de responsmaat ziet – alleen lineaire veranderingen.

Omdat de feitelijke waarden van de log-oddsratio minder intuïtief zijn dan de (lineaire) oddsratio, is het voor visualisaties meestal beter om de oddsratio te plotten en een log-transformatie toe te passen op de y-as.

mdl_churn_vs_relationship, explanatory_data en plt_churn_vs_relationship zijn beschikbaar en dplyr is geladen.

Deze oefening maakt deel uit van de cursus

Introductie tot regressie in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Update the data frame
prediction_data <- explanatory_data %>% 
  mutate(   
    has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
    odds_ratio = has_churned / (1 - has_churned),
    # Add the log odds ratio from odds_ratio
    log_odds_ratio = ___,
    # Add the log odds ratio using predict()
    log_odds_ratio2 = ___
  )

# See the result
prediction_data
Code bewerken en uitvoeren