Kategorische Variablen kodieren – binär
Sieh dir den Datensatz hiking an. Es gibt mehrere Spalten, die vor dem Modellieren kodiert werden müssen, darunter die Spalte Accessible. Accessible ist ein binäres Merkmal, hat also zwei Werte, Y oder N, die in 1 und 0 kodiert werden müssen. Verwende die Methode LabelEncoder aus scikit-learn, um diese Umwandlung durchzuführen.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Speichere
LabelEncoder()in einer Variablen namensenc. - Kodierte mit der Methode
.fit_transform()des Encoders die Spalte"Accessible"deshiking-Datensatzes. Nenne die neue SpalteAccessible_enc. - Vergleiche die beiden Spalten nebeneinander, um die Kodierung zu sehen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())