Eliminação de dados faltantes

Nos próximos três exercícios, você vai organizar o conjunto de dados music_df. Você deve criar um pipeline para imputar valores faltantes e criar um modelo de classificador kNN e, em seguida, usá-lo para prever se uma música é do gênero "Rock".

Neste exercício, especificamente, você deve eliminar os valores faltantes que representam menos de 5% do conjunto de dados e converter a coluna "genre" em uma variável independente binária.

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Print missing values for each column
____