Random Forest-hyperparameters verkennen
Begrijpen welke hyperparameters er zijn en wat hun impact is, is een kernvaardigheid voor elke data scientist. Naarmate modellen complexer worden, zijn er veel instellingen die je kunt wijzigen, maar slechts enkele hebben echt grote invloed op je model.
Je gaat nu een bestaand random forest-model beoordelen (het heeft een paar slechte hyperparameterkeuzes!) en vervolgens betere keuzes maken voor een nieuw random forest-model en de prestaties evalueren.
Je hebt tot je beschikking:
X_train,X_test,y_train,y_testDataFrames- Een bestaand, vooraf getraind random forest-estimator,
rf_clf_old - De voorspellingen van de bestaande random forest-estimator op de testset,
rf_old_predictions
Deze oefening maakt deel uit van de cursus
Hyperparameter Tuning in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))