GridSearchCV met Scikit Learn
De module GridSearchCV van Scikit Learn biedt veel handige functies om efficiënt een grid search uit te voeren. Je gaat nu je kennis toepassen door een GridSearchCV-object aan te maken met bepaalde parameters.
De gewenste opties zijn:
- Een Random Forest-estimator, met het splitcriterium 'entropy'
- 5-voudige cross-validatie
- De hyperparameters
max_depth(2, 4, 8, 15) enmax_features('auto' vs 'sqrt') - Gebruik
roc_aucom de modellen te scoren - Gebruik 4 cores om parallel te verwerken
- Zorg dat je het beste model opnieuw fit en trainingsscores teruggeeft
Je hebt de gegevenssets X_train, X_test, y_train & y_test beschikbaar.
Deze oefening maakt deel uit van de cursus
Hyperparameter Tuning in Python
Oefeninstructies
- Maak een Random Forest-estimator zoals hierboven gespecificeerd.
- Maak een parametergrid zoals hierboven gespecificeerd.
- Maak een
GridSearchCV-object zoals hierboven beschreven, met de twee elementen die je in de vorige twee stappen hebt gemaakt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)