Pipeline pour la prédiction du genre des chansons : II
Après avoir configuré les étapes du pipeline dans l’exercice précédent, vous allez maintenant l’utiliser sur l’ensemble de données music_df
pour classer le genre des chansons. Ce qui rend les pipelines si incroyablement utiles, c’est l’interface simple qu’ils proposent.
X_train
, X_test
, y_train
et y_test
ont été préchargés pour vous, et confusion_matrix
a été importé à partir de sklearn.metrics
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Créez un pipeline en suivant les étapes que vous avez définies précédemment.
- Ajustez le pipeline aux données d’apprentissage.
- Faites des prédictions sur l’ensemble de test.
- Calculez et affichez la matrice de confusion.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))