Codificação de variáveis categóricas - one-hot
Uma das colunas do conjunto de dados volunteer
, category_desc
, fornece descrições de categorias para as oportunidades de voluntariado listadas. Como se trata de uma variável categórica com mais de duas categorias, precisamos usar a codificação one-hot para transformar essa coluna numericamente. Para isso, use a função pd.get_dummies()
do pandas.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Chame
get_dummies()
na colunavolunteer["category_desc"]
para criar as colunas codificadas e atribuí-las acategory_enc
. - Imprima o endereço
.head()
da variávelcategory_enc
para dar uma olhada nas colunas codificadas.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)