Aan de slagGa gratis aan de slag

Afstemmen van het aantal features

De standaardhyperparameters van je modellen zijn niet geoptimaliseerd voor jouw data. Het doel van grid search cross-validation is om die hyperparameters te vinden die zorgen voor optimale modelprestaties. In de video zag je hoe de n_estimators-hyperparameter van de random forest werd afgestemd. Hier ga je oefenen met het afstemmen van de max_features-hyperparameter. De cv-hyperparameter staat op 3 zodat de code snel uitvoert.

Hyperparameter Doel
max_features Aantal features voor de beste splitsing

Een random forest is een ensemble van veel decision trees. De n_estimators-hyperparameter bepaalt het aantal bomen in het forest, terwijl de max_features-hyperparameter het aantal features bepaalt dat de random forest moet overwegen bij het zoeken naar de beste splitsing in een decision tree.

Een random forest-classifier is al voor je geïnstantieerd als clf.

Deze oefening maakt deel uit van de cursus

Marketinganalyse: klantverloop voorspellen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import GridSearchCV
Code bewerken en uitvoeren