CommencerCommencez gratuitement

Suppression des données manquantes

Au cours des trois prochains exercices, vous allez mettre de l’ordre dans le jeu de données music_df. Vous allez créer un pipeline pour imputer les valeurs manquantes et construire un modèle de classificateur KNN, puis l’utiliser pour prédire si une chanson appartient au genre "Rock".

Dans cet exercice, vous allez éliminer les valeurs manquantes représentant moins de 5 % de l’ensemble de données et convertir la colonne "genre" en une caractéristique binaire.

Cet exercice fait partie du cours

<cours>Apprentissage supervisé avec scikit-learn</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Print missing values for each column
____
Modifier et exécuter le code