ComeçarComece de graça

Codificando variáveis categóricas - one-hot

Uma das colunas no conjunto de dados volunteer, category_desc, traz descrições de categoria para as oportunidades de voluntariado listadas. Como é uma variável categórica com mais de duas categorias, precisamos usar one-hot encoding para transformar essa coluna em valores numéricos. Use a função pd.get_dummies() do pandas para fazer isso.

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

  • Chame get_dummies() na coluna volunteer["category_desc"] para criar as colunas codificadas e atribua a category_enc.
  • Imprima o .head() da variável category_enc para dar uma olhada nas colunas codificadas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Editar e executar o código