Codificando variáveis categóricas - one-hot
Uma das colunas no conjunto de dados volunteer, category_desc, traz descrições de categoria para as oportunidades de voluntariado listadas. Como é uma variável categórica com mais de duas categorias, precisamos usar one-hot encoding para transformar essa coluna em valores numéricos. Use a função pd.get_dummies() do pandas para fazer isso.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Chame
get_dummies()na colunavolunteer["category_desc"]para criar as colunas codificadas e atribua acategory_enc. - Imprima o
.head()da variávelcategory_encpara dar uma olhada nas colunas codificadas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)