LoslegenKostenlos loslegen

OOB-Score vs. Testset-Score

Nachdem du bc instanziiert hast, wirst du es nun auf das Trainingsset fitten und die Genauigkeit auf dem Testset sowie die OOB-Genauigkeit auswerten.

Der Datensatz ist bereits für dich aufbereitet und in 80 % Training und 20 % Test aufgeteilt. Die Feature-Matrizen X_train und X_test sowie die Label-Arrays y_train und y_test stehen in deinem Workspace bereit. Außerdem haben wir den in der vorherigen Übung instanziierten Klassifikator bc und die Funktion accuracy_score() aus sklearn.metrics geladen.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Fitte bc auf das Trainingsset, sage die Labels des Testsets voraus und speichere das Ergebnis in y_pred.

  • Werte die Testset-Genauigkeit acc_test aus, indem du accuracy_score aufrufst.

  • Ermittle die OOB-Genauigkeit acc_oob von bc, indem du das Attribut oob_score_ aus bc ausliest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit bc to the training set 
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)

# Evaluate test set accuracy
acc_test = ____(____, ____)

# Evaluate OOB accuracy
acc_oob = ____.____

# Print acc_test and acc_oob
print('Test set accuracy: {:.3f}, OOB accuracy: {:.3f}'.format(acc_test, acc_oob))
Code bearbeiten und ausführen