Suppression des données manquantes
Au cours des trois prochains exercices, vous allez mettre de l’ordre dans le jeu de données music_df. Vous allez créer un pipeline pour imputer les valeurs manquantes et construire un modèle de classificateur KNN, puis l’utiliser pour prédire si une chanson appartient au genre "Rock".
Dans cet exercice, vous allez éliminer les valeurs manquantes représentant moins de 5 % de l’ensemble de données et convertir la colonne "genre" en une caractéristique binaire.
Cet exercice fait partie du cours
<cours>Apprentissage supervisé avec scikit-learn</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Print missing values for each column
____