CommencerCommencer gratuitement

Pipeline pour la prédiction du genre des chansons : II

Après avoir configuré les étapes du pipeline dans l’exercice précédent, vous allez maintenant l’utiliser sur l’ensemble de données music_df pour classer le genre des chansons. Ce qui rend les pipelines si incroyablement utiles, c’est l’interface simple qu’ils proposent.

X_train, X_test, y_train et y_test ont été préchargés pour vous, et confusion_matrix a été importé à partir de sklearn.metrics.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions

  • Créez un pipeline en suivant les étapes que vous avez définies précédemment.
  • Ajustez le pipeline aux données d’apprentissage.
  • Faites des prédictions sur l’ensemble de test.
  • Calculez et affichez la matrice de confusion.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

steps = [("imputer", imp_mean),
        ("knn", knn)]

# Create the pipeline
pipeline = ____(____)

# Fit the pipeline to the training data
____

# Make predictions on the test set
y_pred = ____

# Print the confusion matrix
print(____(____, ____))
Modifier et exécuter le code