Interactietermen
In de video heb je geleerd hoe je interacties opneemt in de modelstructuur wanneer er één continue en één categorische variabele is. In deze oefening analyseer je de effecten van een interactie tussen twee continue variabelen.
Je gebruikt gecentreerde variabelen in plaats van de oorspronkelijke waarden, zodat je de coëfficiënten makkelijker kunt interpreteren, dus vanaf het niveau van de gemiddelde waarden in plaats van 0, wat voor dit onderzoek mogelijk niet logisch is. Met andere woorden: we willen het model niet interpreteren door 0 aan te nemen voor de variabelen arsenic of distance100.
Het model 'switch ~ distance100 + arsenic' is al als model_dist_ars in de werkruimte geladen.
De wells-gegevensset is ook voorgeladen.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import libraries
import statsmodels.api as sm
from statsmodels.formula.api import glm
# Fit GLM and print model summary
model_int = ____('____ ~ ____(____) + ____(____) + ____(____):____(____)',
data = ____, family = ____).____
# View model results
print(____.____)