Afstemmen van het aantal features
De standaardhyperparameters van je modellen zijn niet geoptimaliseerd voor jouw data. Het doel van grid search cross-validation is om die hyperparameters te vinden die zorgen voor optimale modelprestaties. In de video zag je hoe de n_estimators-hyperparameter van de random forest werd afgestemd. Hier ga je oefenen met het afstemmen van de max_features-hyperparameter. De cv-hyperparameter staat op 3 zodat de code snel uitvoert.
| Hyperparameter | Doel |
|---|---|
| max_features | Aantal features voor de beste splitsing |
Een random forest is een ensemble van veel decision trees. De n_estimators-hyperparameter bepaalt het aantal bomen in het forest, terwijl de max_features-hyperparameter het aantal features bepaalt dat de random forest moet overwegen bij het zoeken naar de beste splitsing in een decision tree.
Een random forest-classifier is al voor je geïnstantieerd als clf.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import GridSearchCV