Dummy-Variablen
In der letzten Übung des Kurses bereitest du deine Daten fürs Modellieren vor, indem du nichtnumerische Spalten per Dummy-Codierung umwandelst.
Wenn du zum Beispiel eine Spalte mit Geschlechtswerten 'Male' und 'Female' hast, möchtest du separate Spalten, die angeben, ob die Beobachtung von 'Male' oder 'Female' stammt. Dieser Prozess zum Erstellen von Dummy-Variablen wird auch One-Hot-Encoding genannt.
Du kannst die Funktion get_dummies() aus pandas verwenden, um nichtnumerische Spalten in Dummy-Variablen umzuwandeln.
df_new = pd.get_dummies(df)
Wir haben das flights-DataFrame gefiltert und flights_sub erstellt, damit leichter zu sehen ist, was passiert.
Diese Übung ist Teil des Kurses
Python für R-Nutzer
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Look at the head of flights_sub
print(____)