CommencerCommencez gratuitement

Suppression des données manquantes

Au cours des trois prochains exercices, vous allez mettre de l’ordre dans le jeu de données music_df. Vous allez créer un pipeline pour imputer les valeurs manquantes et construire un modèle de classificateur KNN, puis l’utiliser pour prédire si une chanson appartient au genre "Rock".

Dans cet exercice, vous allez éliminer les valeurs manquantes représentant moins de 5 % de l’ensemble de données et convertir la colonne "genre" en une caractéristique binaire.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Exercice interactif pratique

Essayez-vous à cet exercice en complétant cet exemple de code.

# Print missing values for each column
____
Modifier et exécuter du code