Aan de slagGa gratis aan de slag

Categorische variabelen coderen

In eerdere oefeningen heb je geoefend met het maken van modelmatrices voor continue variabelen en het toepassen van variabeletransformaties. In deze oefening ga je aan de slag met manieren om een categorische variabele te coderen.

Categorische gegevens bieden een manier om relaties te analyseren en te vergelijken tussen verschillende groepen of factoren. Het kiezen van een referentiegroep is daarom belangrijk en vaak wil je, afhankelijk van het onderzoek, de standaardreferentiegroep aanpassen. Een veelvoorkomende reden om de referentiegroep te wijzigen is dat de interpretatie van coëfficiëntschattingen dan passender en interessanter is voor de studie.

In deze oefening kijk je opnieuw naar de crab-gegevensset, waarin color en spine categorische variabelen zijn.

De crab-gegevensset is vooraf geladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import function dmatrix
from ____ import ____

# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
     	   return_type = 'dataframe').head())
Code bewerken en uitvoeren