Coëfficiënten uitgedrukt in odds
Eerder heb je een logistisch regressiemodel gefit voor de kans om van put te wisselen gegeven de arsenic-niveaus. In deze oefening kijk je hoe een andere variabele, distance100, samenhangt met de kans om te wisselen en interpreteer je de coëfficiënten in termen van odds.
Onthoud dat het logistisch regressiemodel is uitgedrukt in log-odds. Om te bepalen met hoeveel de odds vermenigvuldigen bij een toename van 1 in x, exponentieer je de geschatte coëfficiënt. Dit heet ook wel de odds ratio.
Weet dat odds de verhouding zijn van de kans dat een gebeurtenis optreedt tot de kans dat deze niet optreedt. Bijvoorbeeld, als de odds om een spel te winnen 1/2 of 1 op 2 (1:2) zijn, betekent dit dat er voor elke overwinning 2 nederlagen zijn.
De gegevensset wells is geladen in de werkruimte.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Importeer de
statsmodels-library en de functieglmuitstatsmodels.formula.api. Importeer ooknumpyalsnp. - Fit met
glm()een logistisch regressiemodel waarbijswitchwordt voorspeld doordistance100. - Haal de modelcoëfficiënten op met
.params. - Bereken het multiplicatieve effect op de odds met de functie
exp()vannumpy.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))