LoslegenKostenlos starten

Kategorische Variablen kodieren – binär

Sieh dir den Datensatz hiking an. Es gibt mehrere Spalten, die vor dem Modellieren kodiert werden müssen, darunter die Spalte Accessible. Accessible ist ein binäres Merkmal, hat also zwei Werte, Y oder N, die in 1 und 0 kodiert werden müssen. Verwende die Methode LabelEncoder aus scikit-learn, um diese Umwandlung durchzuführen.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Speichere LabelEncoder() in einer Variablen namens enc.
  • Kodierte mit der Methode .fit_transform() des Encoders die Spalte "Accessible" des hiking-Datensatzes. Nenne die neue Spalte Accessible_enc.
  • Vergleiche die beiden Spalten nebeneinander, um die Kodierung zu sehen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Set up the LabelEncoder object
enc = ____

# Apply the encoding to the "Accessible" column
____ = ____.____(____)

# Compare the two columns
print(____[[____, ____]].head())
Code bearbeiten und ausführen