ComenzarEmpieza gratis

GridSearchCV con Scikit Learn

El módulo GridSearchCV de Scikit Learn ofrece muchas funcionalidades útiles para realizar una grid search de forma eficiente. Ahora pondrás en práctica lo aprendido creando un objeto GridSearchCV con ciertos parámetros.

Las opciones deseadas son:

  • Un estimador Random Forest, con el criterio de división 'entropy'
  • Validación cruzada de 5 pliegues
  • Los hiperparámetros max_depth (2, 4, 8, 15) y max_features ('auto' frente a 'sqrt')
  • Usar roc_auc para puntuar los modelos
  • Usar 4 núcleos para procesar en paralelo
  • Asegúrate de reajustar (refit) el mejor modelo y devolver las puntuaciones de entrenamiento

Tendrás disponibles los conjuntos de datos X_train, X_test, y_train y y_test.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Ver curso

Instrucciones del ejercicio

  • Crea un estimador Random Forest según lo especificado en el contexto anterior.
  • Crea una cuadrícula de parámetros según lo especificado en el contexto anterior.
  • Crea un objeto GridSearchCV como se indica en el contexto anterior, usando los dos elementos creados en las dos instrucciones previas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Editar y ejecutar código