Codificando variáveis categóricas - binária
Dê uma olhada no conjunto de dados hiking. Há várias colunas aqui que precisam ser codificadas antes de serem usadas no modelo, e uma delas é a coluna Accessible. Accessible é uma variável binária, então tem dois valores, Y ou N, que precisam ser codificados em 1s e 0s. Use o método LabelEncoder do scikit-learn para fazer essa transformação.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Armazene
LabelEncoder()em uma variável chamadaenc. - Usando o método
.fit_transform()do codificador, codifique a coluna"Accessible"do conjunto de dadoshiking. Nomeie a nova coluna comoAccessible_enc. - Compare as duas colunas lado a lado para ver a codificação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())