Usar los mejores resultados

Aunque es interesante analizar los resultados de nuestra búsqueda en cuadrícula, nuestro objetivo final es práctico: queremos hacer predicciones sobre nuestro conjunto de prueba usando nuestro objeto estimador.

Podemos acceder a este objeto a través de la propiedad best_estimator_ de nuestro objeto de grid search.

Echemos un vistazo a la propiedad best_estimator_, hagamos predicciones y generemos métricas de evaluación. Primero usaremos el predict predeterminado (que devuelve clases), pero luego necesitaremos usar predict_proba en lugar de predict para calcular el roc-auc, ya que roc-auc necesita probabilidades para su cálculo. Usamos un corte [:,1] para obtener las probabilidades de la clase positiva.

Tienes disponibles los conjuntos de datos X_test y y_test, y el objeto grid_rf_class de los ejercicios anteriores.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Instrucciones del ejercicio

Comprueba el tipo de la propiedad best_estimator_.
Usa la propiedad best_estimator_ para hacer predicciones sobre nuestro conjunto de prueba.
Genera una matriz de confusión y una puntuación ROC_AUC a partir de nuestras predicciones.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# See what type of object the best_estimator_ property is
print(____(____.____))

# Create an array of predictions directly using the best_estimator_ property
predictions = grid_rf_class.____._____(X_test)

# Take a look to confirm it worked, this should be an array of 1's and 0's
print(predictions[0:5])

# Now create a confusion matrix 
print("Confusion Matrix \n", confusion_matrix(y_test, ______))

# Get the ROC-AUC score
predictions_proba = grid_rf_class.best_estimator_.predict_proba(X_test)[:,1]
print("ROC-AUC Score \n", roc_auc_score(y_test, _____))

Editar y ejecutar código

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

IntermedioNivel de habilidad

4.9+

Comienza el curso gratis

En este capítulo introductorio aprenderás la diferencia entre hiperparámetros y parámetros. Practicarás extrayendo y analizando parámetros, y configurando valores de hiperparámetros para varios algoritmos populares de Machine Learning. Por el camino, aprenderás consejos y trucos de buenas prácticas para decidir qué hiperparámetros ajustar, qué valores probar y cómo construir curvas de aprendizaje para analizar tus elecciones.

Exercise 1: Introducción y «parámetros»Exercise 2: Parámetros en la regresión logística Exercise 3: Extraer un parámetro de Logistic Regression Exercise 4: Extraer un parámetro de Random Forest Exercise 5: Introducción a los hiperparámetros Exercise 6: Hiperparámetros en Random Forests Exercise 7: Explorando los hiperparámetros de Random Forest Exercise 8: Hiperparámetros de KNN Exercise 9: Definir y analizar valores de hiperparámetros Exercise 10: Automatizar la elección de hiperparámetros Exercise 11: Construir curvas de aprendizaje

Este capítulo te presenta una metodología popular de ajuste automático de hiperparámetros llamada Grid Search. Verás qué es, cómo funciona y practicarás cómo realizar un Grid Search con Scikit Learn. Después aprenderás a analizar el resultado de un Grid Search y ganarás experiencia práctica haciéndolo.

Exercise 1: Introducción a Grid Search Exercise 2: Crea funciones de Grid Search Exercise 3: Ajusta iterativamente varios hiperparámetros Exercise 4: ¿Cuántos modelos?Exercise 5: Grid Search con Scikit Learn Exercise 6: Entradas de GridSearchCV Exercise 7: GridSearchCV con Scikit Learn Exercise 8: Entender la salida de una grid search Exercise 9: Usar los mejores resultados Exercise 10: Explorar los resultados del grid search Exercise 11: Analizar los mejores resultados Exercise 12: Usar los mejores resultados

Ejercicio actual

En este capítulo conocerás otra metodología popular de ajuste automático de hiperparámetros llamada Random Search. Verás qué es, cómo funciona y, sobre todo, en qué se diferencia de grid search. Conocerás algunas ventajas e inconvenientes de este método y cuándo elegirlo frente a Grid Search. Practicarás cómo realizar un Random Search con Scikit Learn, además de visualizar e interpretar los resultados.

Exercise 1: Introducción a Random Search Exercise 2: Muestrea hiperparámetros aleatoriamente Exercise 3: Búsqueda aleatoria con Random Forest Exercise 4: Visualizar un Random Search Exercise 5: Random Search en Scikit Learn Exercise 6: Parámetros de RandomSearchCV Exercise 7: El objeto RandomizedSearchCV Exercise 8: RandomSearchCV en Scikit Learn Exercise 9: Comparando Grid Search y Random Search Exercise 10: Comparando Random Search y Grid Search Exercise 11: Búsqueda en cuadrícula y aleatoria, lado a lado

En este capítulo final tendrás una muestra de metodologías más avanzadas de ajuste de hiperparámetros conocidas como "informed search". Incluye una metodología llamada de grueso a fino (Coarse To Fine), así como algoritmos de ajuste bayesianos y genéticos. Verás en qué se diferencia informed search de uninformed search y adquirirás habilidades prácticas con cada una de las metodologías mencionadas, comparándolas sobre la marcha.

Exercise 1: Búsqueda informada: de lo general a lo específico Exercise 2: Visualizar Coarse to Fine Exercise 3: Iteraciones de Coarse to Fine Exercise 4: Búsqueda informada: estadística bayesiana Exercise 5: Regla de Bayes en Python Exercise 6: Ajuste bayesiano de hiperparámetros con Hyperopt Exercise 7: Búsqueda informada: algoritmos genéticos Exercise 8: Ajuste genético de hiperparámetros con TPOT Exercise 9: Analizando la estabilidad de TPOT Exercise 10: ¡Enhorabuena!