LoslegenKostenlos starten

Kodierung kategorialer Variablen

In den vorherigen Übungen hast du geübt, Modellmatrizen für kontinuierliche Variablen zu erstellen und Variablentransformationen anzuwenden. In dieser Übung beschäftigst du dich damit, wie man eine kategoriale Variable kodiert.

Kategoriale Daten ermöglichen es, Beziehungen zwischen verschiedenen Gruppen oder Faktoren zu analysieren und zu vergleichen. Daher ist die Wahl einer Referenzgruppe wichtig, und je nach Studie möchtest du die Standard-Referenzgruppe möglicherweise ändern. Ein häufiger Grund dafür ist, dass die Interpretation der Koeffizientenschätzungen dadurch für die konkrete Fragestellung passender und interessanter wird.

Für diese Übung schaust du dir erneut den Datensatz crab an, in dem color und spine kategoriale Variablen sind.

Der Datensatz crab ist im Workspace vorab geladen.

Diese Übung ist Teil des Kurses

<Kurs>Generalisierte lineare Modelle in Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import function dmatrix
from ____ import ____

# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
     	   return_type = 'dataframe').head())
Code bearbeiten und ausführen