Aan de slagGa gratis aan de slag

Zoek naar de optimale boom

In deze oefening voer je een grid search uit met 5-fold cross-validatie om de optimale hyperparameters van dt te vinden. Omdat grid search een uitputtend proces is, kan het lang duren om het model te trainen. Hier instantieer je alleen het GridSearchCV-object zonder het te fitten op de trainingsset. Zoals in de video besproken, kun je zo'n object trainen zoals elke scikit-learn-estimator met de .fit()-methode:

grid_object.fit(X_train, y_train)

Een niet-afgestelde classificatieboom dt en de dictionary params_dt die je in de vorige oefening hebt gedefinieerd, zijn beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer GridSearchCV uit sklearn.model_selection.

  • Instantieer een GridSearchCV-object met 5-fold CV door de parameters in te stellen:

    • estimator op dt, param_grid op params_dt en

    • scoring op 'roc_auc'.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Code bewerken en uitvoeren