Aan de slagGa gratis aan de slag

Beoordeel afzonderlijke classificatiemodellen

In deze oefening beoordeel je de prestaties van de modellen in de lijst classifiers die we in de vorige oefening hebben gedefinieerd. Dat doe je door elk model op de trainingsset te fitten en de nauwkeurigheid op de testset te evalueren.

De dataset is al voor je geladen en geprepareerd (numerieke features zijn gestandaardiseerd) en is opgesplitst in 70% train en 30% test. De feature-matrices X_train en X_test, evenals de arrays met labels y_train en y_test, zijn beschikbaar in je werkruimte. Daarnaast hebben we de lijst classifiers uit de vorige oefening geladen, evenals de functie accuracy_score() uit sklearn.metrics.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Loop over de tuples in classifiers. Gebruik clf_name en clf als variabelen in de for-lus:
    • Fit clf op de trainingsset.
    • Voorspel de labels van de testset met clf en sla de resultaten op in y_pred.
    • Evalueer de nauwkeurigheid op de testset van clf en print het resultaat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Iterate over the pre-defined list of classifiers
for clf_name, clf in ____:    
 
    # Fit clf to the training set
    ____.____(____, ____)    
   
    # Predict y_pred
    y_pred = ____.____(____)
    
    # Calculate accuracy
    accuracy = ____(____, ____) 
   
    # Evaluate clf's accuracy on the test set
    print('{:s} : {:.3f}'.format(clf_name, accuracy))
Code bewerken en uitvoeren