Pipeline zur Vorhersage von Genres: Teil 2
In der vorherigen Übung hast du die einzelnen Schritte der Pipeline eingerichtet. Jetzt wendest du sie auf den Datensatz music_df an, um das Genre der Songs zu klassifizieren. Pipelines sind nämlich vor allem deshalb so nützlich, weil sie sich ganz einfach anwenden lassen.
X_train, X_test, y_train und y_test sind bereits geladen und confusion_matrix wurde aus sklearn.metrics importiert.
Diese Übung ist Teil des Kurses
<Kurs>Überwachtes Lernen mit scikit-learn</Kurs>Übungsanweisungen
- Erstelle eine Pipeline mit den Schritten, die du zuvor festgelegt hast.
- Passe die Pipeline an die Trainingsdaten an.
- Triff Vorhersagen für die Testdaten.
- Berechne die Konfusionsmatrix und gib sie aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))