Random-Forest-Hyperparameter erkunden
Zu verstehen, welche Hyperparameter es gibt und wie sich unterschiedliche Einstellungen auswirken, gehört zum Kernhandwerk jedes Data Scientists. Mit zunehmender Modellkomplexität gibt es viele Stellschrauben, aber nur einige haben wirklich großen Einfluss auf dein Modell.
Du bewertest jetzt ein bestehendes Random-Forest-Modell (mit ein paar unglücklichen Hyperparameter-Wahlen!) und triffst anschließend bessere Entscheidungen für ein neues Random-Forest-Modell, dessen Leistung du dann vergleichst.
Dir stehen zur Verfügung:
X_train,X_test,y_train,y_testDataFrames- Ein bereits vortrainierter Random-Forest-Schätzer,
rf_clf_old - Die Vorhersagen des bestehenden Random-Forest-Schätzers auf dem Test-Set,
rf_old_predictions
Diese Übung ist Teil des Kurses
Hyperparameter-Tuning in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))