Aan de slagGa gratis aan de slag

Random Forest-hyperparameters verkennen

Begrijpen welke hyperparameters er zijn en wat hun impact is, is een kernvaardigheid voor elke data scientist. Naarmate modellen complexer worden, zijn er veel instellingen die je kunt wijzigen, maar slechts enkele hebben echt grote invloed op je model.

Je gaat nu een bestaand random forest-model beoordelen (het heeft een paar slechte hyperparameterkeuzes!) en vervolgens betere keuzes maken voor een nieuw random forest-model en de prestaties evalueren.

Je hebt tot je beschikking:

  • X_train, X_test, y_train, y_test DataFrames
  • Een bestaand, vooraf getraind random forest-estimator, rf_clf_old
  • De voorspellingen van de bestaande random forest-estimator op de testset, rf_old_predictions

Deze oefening maakt deel uit van de cursus

Hyperparameter Tuning in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print out the old estimator, notice which hyperparameter is badly set
print(____)

# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
  	confusion_matrix(____, ____),
  	accuracy_score(____, ____))) 
Code bewerken en uitvoeren