Criação de variáveis binárias (dummies)
A possibilidade de incluir variáveis independentes categóricas no processo de criação de modelos pode melhorar o desempenho, pois elas podem acrescentar informações que contribuem para a precisão da previsão.
O conjunto de dados music_df foi pré-carregado para você, e sua forma foi impressa. Além disso, pandas foi importado como pd.
Agora você deve criar um novo DataFrame contendo as colunas originais de music_df mais as variáveis binárias (dummies) da coluna "genre".
Este exercicio faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercicio
- Use uma função pertinente, passando todo o DataFrame
music_df, para criarmusic_dummies, eliminando a primeira coluna binária. - Imprima a forma de
music_dummies.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))