Codificação de variáveis categóricas - binárias
Dê uma olhada no conjunto de dados hiking
. Há várias colunas aqui que precisam ser codificadas antes de serem modeladas, uma das quais é a coluna Accessible
. Accessible
é um recurso binário, portanto, tem dois valores, Y
ou N
, que precisam ser codificados em 1 e 0. Use o método LabelEncoder
do scikit-learn para realizar essa transformação.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Armazene
LabelEncoder()
em uma variável chamadaenc
. - Usando o método
.fit_transform()
do codificador, codifique a coluna"Accessible"
do conjunto de dadoshiking
. Chame a nova coluna deAccessible_enc
. - Compare as duas colunas lado a lado para ver a codificação.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())