LoslegenKostenlos loslegen

Kategorische Variablen kodieren – binär

Sieh dir den Datensatz hiking an. Es gibt mehrere Spalten, die vor dem Modellieren kodiert werden müssen, darunter die Spalte Accessible. Accessible ist ein binäres Merkmal, hat also zwei Werte, Y oder N, die in 1 und 0 kodiert werden müssen. Verwende die Methode LabelEncoder aus scikit-learn, um diese Umwandlung durchzuführen.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Speichere LabelEncoder() in einer Variablen namens enc.
  • Kodierte mit der Methode .fit_transform() des Encoders die Spalte "Accessible" des hiking-Datensatzes. Nenne die neue Spalte Accessible_enc.
  • Vergleiche die beiden Spalten nebeneinander, um die Kodierung zu sehen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Set up the LabelEncoder object
enc = ____

# Apply the encoding to the "Accessible" column
____ = ____.____(____)

# Compare the two columns
print(____[[____, ____]].head())
Code bearbeiten und ausführen