Pipeline zur Vorhersage von Songgenres: Teil 2

Nachdem du in der vorherigen Übung die einzelnen Schritte der Pipeline eingerichtet hast, wendest du sie nun auf den Datensatz music_df an, um das Genre der Lieder zu klassifizieren. Was Pipelines so unglaublich nützlich macht, ist die einfache Schnittstelle, die sie bieten.

X_train, X_test, y_train und y_test sind für dich vorgeladen und confusion_matrix wurde von sklearn.metrics importiert.

Diese Übung ist Teil des Kurses

Überwachtes Lernen mit scikit-learn

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Pipeline mit den Schritten, die du zuvor festgelegt hast.
  • Passe die Pipeline an die Trainingsdaten an.
  • Mache Vorhersagen für die Testmenge.
  • Berechne und drucke die Konfusionsmatrix.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

steps = [("imputer", imp_mean),
        ("knn", knn)]

# Create the pipeline
pipeline = ____(____)

# Fit the pipeline to the training data
____

# Make predictions on the test set
y_pred = ____

# Print the confusion matrix
print(____(____, ____))