OOB-Score vs. Testset-Score
Nachdem du bc instanziiert hast, wirst du es nun auf das Trainingsset fitten und die Genauigkeit auf dem Testset sowie die OOB-Genauigkeit auswerten.
Der Datensatz ist bereits für dich aufbereitet und in 80 % Training und 20 % Test aufgeteilt. Die Feature-Matrizen X_train und X_test sowie die Label-Arrays y_train und y_test stehen in deinem Workspace bereit. Außerdem haben wir den in der vorherigen Übung instanziierten Klassifikator bc und die Funktion accuracy_score() aus sklearn.metrics geladen.
Diese Übung ist Teil des Kurses
<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>Übungsanweisungen
Fitte
bcauf das Trainingsset, sage die Labels des Testsets voraus und speichere das Ergebnis iny_pred.Werte die Testset-Genauigkeit
acc_testaus, indem duaccuracy_scoreaufrufst.Ermittle die OOB-Genauigkeit
acc_oobvonbc, indem du das Attributoob_score_ausbcausliest.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Fit bc to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
# Evaluate test set accuracy
acc_test = ____(____, ____)
# Evaluate OOB accuracy
acc_oob = ____.____
# Print acc_test and acc_oob
print('Test set accuracy: {:.3f}, OOB accuracy: {:.3f}'.format(acc_test, acc_oob))