Categorische variabelen encoden - binair
Bekijk de hiking-gegevensset. Er zijn hier meerdere kolommen die gecodeerd moeten worden voordat je kunt modelleren, waaronder de kolom Accessible. Accessible is een binaire feature, dus heeft twee waarden, Y of N, die je moet encoden naar 1'en en 0'en. Gebruik de methode LabelEncoder van scikit-learn om deze transformatie uit te voeren.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Sla
LabelEncoder()op in een variabele met de naamenc. - Gebruik de
.fit_transform()-methode van de encoder om de kolom"Accessible"van dehiking-gegevensset te encoden. Noem de nieuwe kolomAccessible_enc. - Vergelijk de twee kolommen naast elkaar om de encoding te bekijken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())