Pipeline pour la prédiction du genre des chansons : I
Il est maintenant temps de construire un pipeline. Il contiendra des étapes pour imputer les valeurs manquantes en utilisant la moyenne pour chaque caractéristique et construire un modèle KNN pour la classification du genre de la chanson.
L’ensemble de données music_df
modifié que vous avez créé dans l’exercice précédent a été préchargé pour vous, ainsi que KNeighborsClassifier
et train_test_split
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
SimpleImputer
etPipeline
. - Instanciez un imputeur.
- Instanciez un classificateur KNN avec trois voisins.
- Créez
steps
, une liste d’uplets contenant l’imputeur que vous avez créée, appelé"imputer"
, suivi du modèleknn
que vous avez créé, appelé"knn"
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import modules
____
____
# Instantiate an imputer
imputer = ____()
# Instantiate a knn model
knn = ____
# Build steps for the pipeline
steps = [("____", ____),
("____", ____)]