Codificación de variables categóricas - binarias
Echa un vistazo al conjunto de datos hiking
. Aquí hay varias columnas que hay que codificar antes de modelarlas, una de ellas es la columna Accessible
. Accessible
es una característica binaria, por lo que tiene dos valores, Y
o N
, que hay que codificar en 1 y 0. Utiliza el método LabelEncoder
de scikit-learn para realizar esta transformación.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Guarda
LabelEncoder()
en una variable llamadaenc
. - Utilizando el método
.fit_transform()
del codificador, codifica la columna"Accessible"
del conjunto de datoshiking
. Llama a la nueva columnaAccessible_enc
. - Compara las dos columnas una al lado de la otra para ver la codificación.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())