Criação de variáveis binárias (dummies)

A possibilidade de incluir variáveis independentes categóricas no processo de criação de modelos pode melhorar o desempenho, pois elas podem acrescentar informações que contribuem para a precisão da previsão.

O conjunto de dados music_df foi pré-carregado para você, e sua forma foi impressa. foi importado como pandas.

Agora você deve criar um novo DataFrame contendo as colunas originais de music_df mais as variáveis binárias (dummies) da coluna "genre".

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver Curso

Instruções de exercício

  • Use uma função pertinente, passando todo o DataFrame music_df, para criar music_dummies, eliminando a primeira coluna binária.
  • Imprima a forma de music_dummies.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create music_dummies
music_dummies = ____

# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))