LoslegenKostenlos loslegen

Kategorische Variablen encodieren – One-Hot

Eine der Spalten im Datensatz volunteer, category_desc, enthält Kategorienbeschreibungen für die aufgeführten Freiwilligenangebote. Da es sich um eine kategoriale Variable mit mehr als zwei Kategorien handelt, müssen wir One-Hot-Encoding verwenden, um diese Spalte numerisch darzustellen. Verwende dafür die pandas-Funktion pd.get_dummies().

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Rufe get_dummies() auf der Spalte volunteer["category_desc"] auf, um die encodeten Spalten zu erstellen, und weise das Ergebnis category_enc zu.
  • Gib die .head() von category_enc aus, um dir die encodeten Spalten anzusehen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Code bearbeiten und ausführen