ComeçarComece gratuitamente

Codificação de variáveis categóricas - one-hot

Uma das colunas do conjunto de dados volunteer, category_desc, fornece descrições de categorias para as oportunidades de voluntariado listadas. Como se trata de uma variável categórica com mais de duas categorias, precisamos usar a codificação one-hot para transformar essa coluna numericamente. Para isso, use a função pd.get_dummies() do pandas.

Este exercício faz parte do curso

Pré-processamento para aprendizado de máquina em Python

Ver Curso

Instruções de exercício

  • Chame get_dummies() na coluna volunteer["category_desc"] para criar as colunas codificadas e atribuí-las a category_enc.
  • Imprima o endereço .head() da variável category_enc para dar uma olhada nas colunas codificadas.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Editar e executar código