Eliminação de dados faltantes
Nos próximos três exercícios, você vai organizar o conjunto de dados music_df
. Você deve criar um pipeline para imputar valores faltantes e criar um modelo de classificador kNN e, em seguida, usá-lo para prever se uma música é do gênero "Rock"
.
Neste exercício, especificamente, você deve eliminar os valores faltantes que representam menos de 5% do conjunto de dados e converter a coluna "genre"
em uma variável independente binária.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Print missing values for each column
____