ComeçarComece de graça

One-hot encoding e variáveis dummies

Para usar variáveis categóricas em um modelo de Machine Learning, primeiro você precisa representá-las de forma quantitativa. As duas abordagens mais comuns são aplicar one-hot encoding às variáveis ou usar variáveis dummies. Neste exercício, você vai criar ambos os tipos de codificação e comparar os conjuntos de colunas gerados. Continuaremos usando o mesmo DataFrame da lição anterior, carregado como so_survey_df, focando na coluna Country.

Este exercício faz parte do curso

Feature Engineering for Machine Learning in Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')

# Print the columns names
print(one_hot_encoded.columns)
Editar e executar o código