Pipeline zur Vorhersage von Songgenres: Teil 2
Nachdem du in der vorherigen Übung die einzelnen Schritte der Pipeline eingerichtet hast, wendest du sie nun auf den Datensatz music_df
an, um das Genre der Lieder zu klassifizieren. Was Pipelines so unglaublich nützlich macht, ist die einfache Schnittstelle, die sie bieten.
X_train
, X_test
, y_train
und y_test
sind für dich vorgeladen und confusion_matrix
wurde von sklearn.metrics
importiert.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Erstelle eine Pipeline mit den Schritten, die du zuvor festgelegt hast.
- Passe die Pipeline an die Trainingsdaten an.
- Mache Vorhersagen für die Testmenge.
- Berechne und drucke die Konfusionsmatrix.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))