GridSearchCV con Scikit Learn
Il modulo GridSearchCV di Scikit Learn offre molte funzionalità utili per svolgere in modo efficiente una grid search. Ora metterai in pratica ciò che hai imparato creando un oggetto GridSearchCV con determinati parametri.
Le opzioni richieste sono:
- Un estimatore Random Forest, con criterio di split 'entropy'
- Cross-validation a 5 fold
- Gli iperparametri
max_depth(2, 4, 8, 15) emax_features('auto' vs 'sqrt') - Usa
roc_aucper valutare i modelli - Usa 4 core per l’elaborazione in parallelo
- Assicurati di eseguire il refit del modello migliore e di restituire gli score di training
Avrai a disposizione gli insiemi di dati X_train, X_test, y_train e y_test.
Questo esercizio fa parte del corso
Ottimizzazione degli iperparametri in Python
Istruzioni dell'esercizio
- Crea un estimatore Random Forest come specificato nel contesto sopra.
- Crea una griglia di parametri come specificato nel contesto sopra.
- Crea un oggetto
GridSearchCVcome descritto nel contesto sopra, utilizzando i due elementi creati nelle due istruzioni precedenti.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)