Beoordeel afzonderlijke classificatiemodellen
In deze oefening beoordeel je de prestaties van de modellen in de lijst classifiers die we in de vorige oefening hebben gedefinieerd. Dat doe je door elk model op de trainingsset te fitten en de nauwkeurigheid op de testset te evalueren.
De dataset is al voor je geladen en geprepareerd (numerieke features zijn gestandaardiseerd) en is opgesplitst in 70% train en 30% test. De feature-matrices X_train en X_test, evenals de arrays met labels y_train en y_test, zijn beschikbaar in je werkruimte. Daarnaast hebben we de lijst classifiers uit de vorige oefening geladen, evenals de functie accuracy_score() uit sklearn.metrics.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
- Loop over de tuples in
classifiers. Gebruikclf_nameenclfals variabelen in defor-lus:- Fit
clfop de trainingsset. - Voorspel de labels van de testset met
clfen sla de resultaten op iny_pred. - Evalueer de nauwkeurigheid op de testset van
clfen print het resultaat.
- Fit
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Iterate over the pre-defined list of classifiers
for clf_name, clf in ____:
# Fit clf to the training set
____.____(____, ____)
# Predict y_pred
y_pred = ____.____(____)
# Calculate accuracy
accuracy = ____(____, ____)
# Evaluate clf's accuracy on the test set
print('{:s} : {:.3f}'.format(clf_name, accuracy))