CommencerCommencez gratuitement

Pipeline pour la prédiction du genre des chansons : I

Il est maintenant temps de construire un pipeline. Il contiendra des étapes pour imputer les valeurs manquantes en utilisant la moyenne pour chaque caractéristique et construire un modèle KNN pour la classification du genre de la chanson.

L’ensemble de données music_df modifié que vous avez créé dans l’exercice précédent a été préchargé pour vous, ainsi que KNeighborsClassifier et train_test_split.

Cet exercice fait partie du cours

<cours>Apprentissage supervisé avec scikit-learn</cours>
Voir le cours

Instructions de l’exercice

  • Importez SimpleImputer et Pipeline.
  • Instanciez un imputeur.
  • Instanciez un classificateur KNN avec trois voisins.
  • Créez steps, une liste d’uplets contenant l’imputeur que vous avez créée, appelé "imputer", suivi du modèle knn que vous avez créé, appelé "knn".

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import modules
____
____

# Instantiate an imputer
imputer = ____()

# Instantiate a knn model
knn = ____

# Build steps for the pipeline
steps = [("____", ____), 
         ("____", ____)]
Modifier et exécuter le code