IniziaInizia gratis

Ottimizzare il numero di feature

Gli iperparametri predefiniti dei tuoi modelli non sono ottimizzati per i tuoi dati. L’obiettivo della grid search con cross-validation è identificare gli iperparametri che portano alle migliori prestazioni del modello. Nel video hai visto come è stato ottimizzato l’iperparametro n_estimators della random forest. Qui farai pratica con l’iperparametro max_features. L’iperparametro cv è impostato a 3 per eseguire il codice rapidamente.

Hyperparameter Purpose
max_features Numero di feature per la miglior suddivisione

Una random forest è un insieme (ensemble) di molti alberi decisionali. L’iperparametro n_estimators controlla il numero di alberi da usare nella foresta, mentre max_features controlla quante feature la random forest deve considerare quando cerca la miglior suddivisione in un albero decisionale.

Un classificatore random forest è già stato istanziato per te come clf.

Questo esercizio fa parte del corso

Marketing Analytics: Prevedere il churn dei clienti in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import GridSearchCV
Modifica ed esegui il codice