Kategorische Variablen encodieren – One-Hot
Eine der Spalten im Datensatz volunteer, category_desc, enthält Kategorienbeschreibungen für die aufgeführten Freiwilligenangebote. Da es sich um eine kategoriale Variable mit mehr als zwei Kategorien handelt, müssen wir One-Hot-Encoding verwenden, um diese Spalte numerisch darzustellen. Verwende dafür die pandas-Funktion pd.get_dummies().
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Rufe
get_dummies()auf der Spaltevolunteer["category_desc"]auf, um die encodeten Spalten zu erstellen, und weise das Ergebniscategory_enczu. - Gib die
.head()voncategory_encaus, um dir die encodeten Spalten anzusehen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)