Aan de slagGa gratis aan de slag

Pipeline voor het voorspellen van muziekgenres: II

Nu je in de vorige oefening de stappen van de pipeline hebt opgezet, ga je deze gebruiken op de gegevensset music_df om het genre van nummers te classificeren. Wat pipelines zo ontzettend handig maakt, is de eenvoudige interface die ze bieden.

X_train, X_test, y_train en y_test zijn alvast voor je ingeladen, en confusion_matrix is geïmporteerd uit sklearn.metrics.

Deze oefening maakt deel uit van de cursus

Supervised Learning met scikit-learn

Cursus bekijken

Oefeninstructies

  • Maak een pipeline met de stappen die je eerder hebt gedefinieerd.
  • Fit de pipeline op de trainingsdata.
  • Maak voorspellingen op de testset.
  • Bereken en print de confusion matrix.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

steps = [("imputer", imp_mean),
        ("knn", knn)]

# Create the pipeline
pipeline = ____(____)

# Fit the pipeline to the training data
____

# Make predictions on the test set
y_pred = ____

# Print the confusion matrix
print(____(____, ____))
Code bewerken en uitvoeren