Aan de slagGa gratis aan de slag

Categorische variabelen encoden - binair

Bekijk de hiking-gegevensset. Er zijn hier meerdere kolommen die gecodeerd moeten worden voordat je kunt modelleren, waaronder de kolom Accessible. Accessible is een binaire feature, dus heeft twee waarden, Y of N, die je moet encoden naar 1'en en 0'en. Gebruik de methode LabelEncoder van scikit-learn om deze transformatie uit te voeren.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Sla LabelEncoder() op in een variabele met de naam enc.
  • Gebruik de .fit_transform()-methode van de encoder om de kolom "Accessible" van de hiking-gegevensset te encoden. Noem de nieuwe kolom Accessible_enc.
  • Vergelijk de twee kolommen naast elkaar om de encoding te bekijken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Set up the LabelEncoder object
enc = ____

# Apply the encoding to the "Accessible" column
____ = ____.____(____)

# Compare the two columns
print(____[[____, ____]].head())
Code bewerken en uitvoeren