LoslegenKostenlos starten

Kategorische Variablen encodieren – One-Hot

Eine der Spalten im Datensatz volunteer, category_desc, enthält Kategorienbeschreibungen für die aufgeführten Freiwilligenangebote. Da es sich um eine kategoriale Variable mit mehr als zwei Kategorien handelt, müssen wir One-Hot-Encoding verwenden, um diese Spalte numerisch darzustellen. Verwende dafür die pandas-Funktion pd.get_dummies().

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Rufe get_dummies() auf der Spalte volunteer["category_desc"] auf, um die encodeten Spalten zu erstellen, und weise das Ergebnis category_enc zu.
  • Gib die .head() von category_enc aus, um dir die encodeten Spalten anzusehen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Code bearbeiten und ausführen