Pipeline zur Vorhersage von Genres: Teil 2
In der vorherigen Übung hast du die einzelnen Schritte der Pipeline eingerichtet. Jetzt wendest du sie auf den Datensatz music_df
an, um das Genre der Songs zu klassifizieren. Pipelines sind nämlich vor allem deshalb so nützlich, weil sie sich ganz einfach anwenden lassen.
X_train
, X_test
, y_train
und y_test
sind bereits geladen und confusion_matrix
wurde aus sklearn.metrics
importiert.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Erstelle eine Pipeline mit den Schritten, die du zuvor festgelegt hast.
- Passe die Pipeline an die Trainingsdaten an.
- Triff Vorhersagen für die Testdaten.
- Berechne die Konfusionsmatrix und gib sie aus.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))