GridSearchCV con Scikit Learn
El módulo GridSearchCV de Scikit Learn ofrece muchas funcionalidades útiles para realizar una grid search de forma eficiente. Ahora pondrás en práctica lo aprendido creando un objeto GridSearchCV con ciertos parámetros.
Las opciones deseadas son:
- Un estimador Random Forest, con el criterio de división 'entropy'
- Validación cruzada de 5 pliegues
- Los hiperparámetros
max_depth(2, 4, 8, 15) ymax_features('auto' frente a 'sqrt') - Usar
roc_aucpara puntuar los modelos - Usar 4 núcleos para procesar en paralelo
- Asegúrate de reajustar (refit) el mejor modelo y devolver las puntuaciones de entrenamiento
Tendrás disponibles los conjuntos de datos X_train, X_test, y_train y y_test.
Este ejercicio forma parte del curso
Ajuste de hiperparámetros en Python
Instrucciones del ejercicio
- Crea un estimador Random Forest según lo especificado en el contexto anterior.
- Crea una cuadrícula de parámetros según lo especificado en el contexto anterior.
- Crea un objeto
GridSearchCVcomo se indica en el contexto anterior, usando los dos elementos creados en las dos instrucciones previas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)