ComenzarEmpieza gratis

Búsqueda en malla

El ajuste de hiperparámetros puede hacerse con sklearn proporcionando varios parámetros de entrada, cada uno de los cuales puede generarse con distintas funciones de numpy. Un método de ajuste que evalúa de forma exhaustiva todas las combinaciones de hiperparámetros especificadas mediante param_grid es la búsqueda en malla (grid search). En este ejercicio, usarás una búsqueda en malla para explorar los hiperparámetros de un clasificador de random forest de ejemplo, utilizando como función de evaluación el AUC de la curva ROC.

X_train, y_train, X_test, y_test están disponibles en tu espacio de trabajo. pandas como pd, numpy como np y sklearn también están disponibles. Además, GridSearchCV() de sklearn.model_selection está disponible.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Crea la lista de valores para cada hiperparámetro en n_estimators y max_depth.
  • Crea un clasificador de random forest.
  • Configura una búsqueda en malla para iterar por todas las combinaciones de hiperparámetros.
  • Imprime el mejor AUC usando .best_score_ y el mejor estimador que llevó a esa puntuación usando .best_estimator_.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create list of hyperparameters 
n_estimators = [10, 50]
max_depth = [5, 20]
param_grid = {'n_estimators': ____, 'max_depth': ____}

# Use Grid search CV to find best parameters 
print("starting RF grid search.. ")
rf = ____()
clf = ____(estimator = rf, param_grid = ____, scoring = 'roc_auc')
clf.fit(X_train, y_train)
print("Best Score: ")
print(clf.____)
print("Best Estimator: ")
print(clf.____)
Editar y ejecutar código