LoslegenKostenlos loslegen

Dummy-Variablen

In der letzten Übung des Kurses bereitest du deine Daten fürs Modellieren vor, indem du nichtnumerische Spalten per Dummy-Codierung umwandelst. Wenn du zum Beispiel eine Spalte mit Geschlechtswerten 'Male' und 'Female' hast, möchtest du separate Spalten, die angeben, ob die Beobachtung von 'Male' oder 'Female' stammt. Dieser Prozess zum Erstellen von Dummy-Variablen wird auch One-Hot-Encoding genannt.

Du kannst die Funktion get_dummies() aus pandas verwenden, um nichtnumerische Spalten in Dummy-Variablen umzuwandeln.

df_new = pd.get_dummies(df)

Wir haben das flights-DataFrame gefiltert und flights_sub erstellt, damit leichter zu sehen ist, was passiert.

Diese Übung ist Teil des Kurses

Python für R-Nutzer

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Look at the head of flights_sub
print(____)
Code bearbeiten und ausführen