Ottimizzare il numero di feature
Gli iperparametri predefiniti dei tuoi modelli non sono ottimizzati per i tuoi dati. L’obiettivo della grid search con cross-validation è identificare gli iperparametri che portano alle migliori prestazioni del modello. Nel video hai visto come è stato ottimizzato l’iperparametro n_estimators della random forest. Qui farai pratica con l’iperparametro max_features. L’iperparametro cv è impostato a 3 per eseguire il codice rapidamente.
| Hyperparameter | Purpose |
|---|---|
| max_features | Numero di feature per la miglior suddivisione |
Una random forest è un insieme (ensemble) di molti alberi decisionali. L’iperparametro n_estimators controlla il numero di alberi da usare nella foresta, mentre max_features controlla quante feature la random forest deve considerare quando cerca la miglior suddivisione in un albero decisionale.
Un classificatore random forest è già stato istanziato per te come clf.
Questo esercizio fa parte del corso
Marketing Analytics: Prevedere il churn dei clienti in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import GridSearchCV