Aan de slagGa gratis aan de slag

Coëfficiënten uitgedrukt in odds

Eerder heb je een logistisch regressiemodel gefit voor de kans om van put te wisselen gegeven de arsenic-niveaus. In deze oefening kijk je hoe een andere variabele, distance100, samenhangt met de kans om te wisselen en interpreteer je de coëfficiënten in termen van odds.

Onthoud dat het logistisch regressiemodel is uitgedrukt in log-odds. Om te bepalen met hoeveel de odds vermenigvuldigen bij een toename van 1 in x, exponentieer je de geschatte coëfficiënt. Dit heet ook wel de odds ratio.

Weet dat odds de verhouding zijn van de kans dat een gebeurtenis optreedt tot de kans dat deze niet optreedt. Bijvoorbeeld, als de odds om een spel te winnen 1/2 of 1 op 2 (1:2) zijn, betekent dit dat er voor elke overwinning 2 nederlagen zijn.

De gegevensset wells is geladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

  • Importeer de statsmodels-library en de functie glm uit statsmodels.formula.api. Importeer ook numpy als np.
  • Fit met glm() een logistisch regressiemodel waarbij switch wordt voorspeld door distance100.
  • Haal de modelcoëfficiënten op met .params.
  • Bereken het multiplicatieve effect op de odds met de functie exp() van numpy.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____

# Fit logistic regression model
model_GLM = ____(formula = ____,
                data = ____,
                family = ____.____.____).____ 

# Extract model coefficients
print('Model coefficients: \n', ____.____)

# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))
Code bewerken en uitvoeren