OOB-Score vs. Testset-Score
Nachdem du bc instanziiert hast, wirst du es nun auf das Trainingsset fitten und die Genauigkeit auf dem Testset sowie die OOB-Genauigkeit auswerten.
Der Datensatz ist bereits für dich aufbereitet und in 80 % Training und 20 % Test aufgeteilt. Die Feature-Matrizen X_train und X_test sowie die Label-Arrays y_train und y_test stehen in deinem Workspace bereit. Außerdem haben wir den in der vorherigen Übung instanziierten Klassifikator bc und die Funktion accuracy_score() aus sklearn.metrics geladen.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Fitte
bcauf das Trainingsset, sage die Labels des Testsets voraus und speichere das Ergebnis iny_pred.Werte die Testset-Genauigkeit
acc_testaus, indem duaccuracy_scoreaufrufst.Ermittle die OOB-Genauigkeit
acc_oobvonbc, indem du das Attributoob_score_ausbcausliest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit bc to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
# Evaluate test set accuracy
acc_test = ____(____, ____)
# Evaluate OOB accuracy
acc_oob = ____.____
# Print acc_test and acc_oob
print('Test set accuracy: {:.3f}, OOB accuracy: {:.3f}'.format(acc_test, acc_oob))