Kodierung kategorialer Variablen
In den vorherigen Übungen hast du geübt, Modellmatrizen für kontinuierliche Variablen zu erstellen und Variablentransformationen anzuwenden. In dieser Übung beschäftigst du dich damit, wie man eine kategoriale Variable kodiert.
Kategoriale Daten ermöglichen es, Beziehungen zwischen verschiedenen Gruppen oder Faktoren zu analysieren und zu vergleichen. Daher ist die Wahl einer Referenzgruppe wichtig, und je nach Studie möchtest du die Standard-Referenzgruppe möglicherweise ändern. Ein häufiger Grund dafür ist, dass die Interpretation der Koeffizientenschätzungen dadurch für die konkrete Fragestellung passender und interessanter wird.
Für diese Übung schaust du dir erneut den Datensatz crab an, in dem color und spine kategoriale Variablen sind.
Der Datensatz crab ist im Workspace vorab geladen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())