OOB-score vs. testset-score
Nu je bc hebt geïnstantieerd, ga je het model fitten op de trainingsset en de nauwkeurigheid op zowel de testset als de OOB-schatting evalueren.
De gegevensset is al voor je verwerkt en gesplitst in 80% train en 20% test. De feature-matrices X_train en X_test, en de label-arrays y_train en y_test zijn beschikbaar in je werkruimte. Daarnaast hebben we de classifier bc (geïnstantieerd in de vorige oefening) en de functie accuracy_score() uit sklearn.metrics al geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
Fit
bcop de trainingsset, voorspel de labels voor de testset en sla de resultaten op iny_pred.Evalueer de testset-nauwkeurigheid
acc_testdooraccuracy_scoreaan te roepen.Evalueer de OOB-nauwkeurigheid
acc_oobvanbcdoor het attribuutoob_score_uitbcte halen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit bc to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
# Evaluate test set accuracy
acc_test = ____(____, ____)
# Evaluate OOB accuracy
acc_oob = ____.____
# Print acc_test and acc_oob
print('Test set accuracy: {:.3f}, OOB accuracy: {:.3f}'.format(acc_test, acc_oob))