Aan de slagGa gratis aan de slag

GridSearchCV met Scikit Learn

De module GridSearchCV van Scikit Learn biedt veel handige functies om efficiënt een grid search uit te voeren. Je gaat nu je kennis toepassen door een GridSearchCV-object aan te maken met bepaalde parameters.

De gewenste opties zijn:

  • Een Random Forest-estimator, met het splitcriterium 'entropy'
  • 5-voudige cross-validatie
  • De hyperparameters max_depth (2, 4, 8, 15) en max_features ('auto' vs 'sqrt')
  • Gebruik roc_auc om de modellen te scoren
  • Gebruik 4 cores om parallel te verwerken
  • Zorg dat je het beste model opnieuw fit en trainingsscores teruggeeft

Je hebt de gegevenssets X_train, X_test, y_train & y_test beschikbaar.

Deze oefening maakt deel uit van de cursus

Hyperparameter Tuning in Python

Cursus bekijken

Oefeninstructies

  • Maak een Random Forest-estimator zoals hierboven gespecificeerd.
  • Maak een parametergrid zoals hierboven gespecificeerd.
  • Maak een GridSearchCV-object zoals hierboven beschreven, met de twee elementen die je in de vorige twee stappen hebt gemaakt.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Code bewerken en uitvoeren