Kategorische Variablen encodieren – One-Hot
Eine der Spalten im Datensatz volunteer, category_desc, enthält Kategorienbeschreibungen für die aufgeführten Freiwilligenangebote. Da es sich um eine kategoriale Variable mit mehr als zwei Kategorien handelt, müssen wir One-Hot-Encoding verwenden, um diese Spalte numerisch darzustellen. Verwende dafür die pandas-Funktion pd.get_dummies().
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Rufe
get_dummies()auf der Spaltevolunteer["category_desc"]auf, um die encodeten Spalten zu erstellen, und weise das Ergebniscategory_enczu. - Gib die
.head()voncategory_encaus, um dir die encodeten Spalten anzusehen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)