Suppression des données manquantes
Au cours des trois prochains exercices, vous allez mettre de l’ordre dans le jeu de données music_df. Vous allez créer un pipeline pour imputer les valeurs manquantes et construire un modèle de classificateur KNN, puis l’utiliser pour prédire si une chanson appartient au genre "Rock".
Dans cet exercice, vous allez éliminer les valeurs manquantes représentant moins de 5 % de l’ensemble de données et convertir la colonne "genre" en une caractéristique binaire.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print missing values for each column
____