Pipeline voor het voorspellen van muziekgenres: II
Nu je in de vorige oefening de stappen van de pipeline hebt opgezet, ga je deze gebruiken op de gegevensset music_df om het genre van nummers te classificeren. Wat pipelines zo ontzettend handig maakt, is de eenvoudige interface die ze bieden.
X_train, X_test, y_train en y_test zijn alvast voor je ingeladen, en confusion_matrix is geïmporteerd uit sklearn.metrics.
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Oefeninstructies
- Maak een pipeline met de stappen die je eerder hebt gedefinieerd.
- Fit de pipeline op de trainingsdata.
- Maak voorspellingen op de testset.
- Bereken en print de confusion matrix.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))