Aan de slagGa gratis aan de slag

OOB-score vs. testset-score

Nu je bc hebt geïnstantieerd, ga je het model fitten op de trainingsset en de nauwkeurigheid op zowel de testset als de OOB-schatting evalueren.

De gegevensset is al voor je verwerkt en gesplitst in 80% train en 20% test. De feature-matrices X_train en X_test, en de label-arrays y_train en y_test zijn beschikbaar in je werkruimte. Daarnaast hebben we de classifier bc (geïnstantieerd in de vorige oefening) en de functie accuracy_score() uit sklearn.metrics al geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Fit bc op de trainingsset, voorspel de labels voor de testset en sla de resultaten op in y_pred.

  • Evalueer de testset-nauwkeurigheid acc_test door accuracy_score aan te roepen.

  • Evalueer de OOB-nauwkeurigheid acc_oob van bc door het attribuut oob_score_ uit bc te halen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit bc to the training set 
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)

# Evaluate test set accuracy
acc_test = ____(____, ____)

# Evaluate OOB accuracy
acc_oob = ____.____

# Print acc_test and acc_oob
print('Test set accuracy: {:.3f}, OOB accuracy: {:.3f}'.format(acc_test, acc_oob))
Code bewerken en uitvoeren