Codificação de variáveis categóricas - one-hot
Uma das colunas do conjunto de dados volunteer, category_desc, fornece descrições de categorias para as oportunidades de voluntariado listadas. Como se trata de uma variável categórica com mais de duas categorias, precisamos usar a codificação one-hot para transformar essa coluna numericamente. Para isso, use a função pd.get_dummies() do pandas.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Chame
get_dummies()na colunavolunteer["category_desc"]para criar as colunas codificadas e atribuí-las acategory_enc. - Imprima o endereço
.head()da variávelcategory_encpara dar uma olhada nas colunas codificadas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)