LoslegenKostenlos loslegen

Kodierung kategorialer Variablen

In den vorherigen Übungen hast du geübt, Modellmatrizen für kontinuierliche Variablen zu erstellen und Variablentransformationen anzuwenden. In dieser Übung beschäftigst du dich damit, wie man eine kategoriale Variable kodiert.

Kategoriale Daten ermöglichen es, Beziehungen zwischen verschiedenen Gruppen oder Faktoren zu analysieren und zu vergleichen. Daher ist die Wahl einer Referenzgruppe wichtig, und je nach Studie möchtest du die Standard-Referenzgruppe möglicherweise ändern. Ein häufiger Grund dafür ist, dass die Interpretation der Koeffizientenschätzungen dadurch für die konkrete Fragestellung passender und interessanter wird.

Für diese Übung schaust du dir erneut den Datensatz crab an, in dem color und spine kategoriale Variablen sind.

Der Datensatz crab ist im Workspace vorab geladen.

Diese Übung ist Teil des Kurses

Generalisierte lineare Modelle in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import function dmatrix
from ____ import ____

# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
     	   return_type = 'dataframe').head())
Code bearbeiten und ausführen