Suppression des données manquantes
Au cours des trois prochains exercices, vous allez mettre de l’ordre dans le jeu de données music_df
. Vous allez créer un pipeline pour imputer les valeurs manquantes et construire un modèle de classificateur KNN, puis l’utiliser pour prédire si une chanson appartient au genre "Rock"
.
Dans cet exercice, vous allez éliminer les valeurs manquantes représentant moins de 5 % de l’ensemble de données et convertir la colonne "genre"
en une caractéristique binaire.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Exercice interactif pratique
Essayez-vous à cet exercice en complétant cet exemple de code.
# Print missing values for each column
____