IniziaInizia gratis

GridSearchCV con Scikit Learn

Il modulo GridSearchCV di Scikit Learn offre molte funzionalità utili per svolgere in modo efficiente una grid search. Ora metterai in pratica ciò che hai imparato creando un oggetto GridSearchCV con determinati parametri.

Le opzioni richieste sono:

  • Un estimatore Random Forest, con criterio di split 'entropy'
  • Cross-validation a 5 fold
  • Gli iperparametri max_depth (2, 4, 8, 15) e max_features ('auto' vs 'sqrt')
  • Usa roc_auc per valutare i modelli
  • Usa 4 core per l’elaborazione in parallelo
  • Assicurati di eseguire il refit del modello migliore e di restituire gli score di training

Avrai a disposizione gli insiemi di dati X_train, X_test, y_train e y_test.

Questo esercizio fa parte del corso

Ottimizzazione degli iperparametri in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un estimatore Random Forest come specificato nel contesto sopra.
  • Crea una griglia di parametri come specificato nel contesto sopra.
  • Crea un oggetto GridSearchCV come descritto nel contesto sopra, utilizzando i due elementi creati nelle due istruzioni precedenti.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Modifica ed esegui il codice