One-hot encoding e variáveis dummies
Para usar variáveis categóricas em um modelo de Machine Learning, primeiro você precisa representá-las de forma quantitativa. As duas abordagens mais comuns são aplicar one-hot encoding às variáveis ou usar variáveis dummies. Neste exercício, você vai criar ambos os tipos de codificação e comparar os conjuntos de colunas gerados. Continuaremos usando o mesmo DataFrame da lição anterior, carregado como so_survey_df, focando na coluna Country.
Este exercício faz parte do curso
Feature Engineering for Machine Learning in Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)