Criação de variáveis binárias (dummies)
A possibilidade de incluir variáveis independentes categóricas no processo de criação de modelos pode melhorar o desempenho, pois elas podem acrescentar informações que contribuem para a precisão da previsão.
O conjunto de dados music_df
foi pré-carregado para você, e sua forma foi impressa. foi importado como pandas
.
Agora você deve criar um novo DataFrame contendo as colunas originais de music_df
mais as variáveis binárias (dummies) da coluna "genre"
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções de exercício
- Use uma função pertinente, passando todo o DataFrame
music_df
, para criarmusic_dummies
, eliminando a primeira coluna binária. - Imprima a forma de
music_dummies
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))