Automatizar la elección de hiperparámetros

Encontrar el mejor hiperparámetro de interés sin escribir cientos de líneas de código para cientos de modelos es una mejora de eficiencia importante que te ayudará mucho al crear futuros modelos de machine learning.

Un hiperparámetro importante para el algoritmo GBM es la tasa de aprendizaje (learning rate). Pero, ¿qué tasa de aprendizaje es la mejor para este problema? Si escribes un bucle que explore varias posibilidades, las recopiles y las visualices, podrás encontrar la mejor.

Las tasas de aprendizaje que puedes probar incluyen 0.001, 0.01, 0.05, 0.1, 0.2 y 0.5

Tendrás disponibles los conjuntos de datos X_train, X_test, y_train y y_test, y GradientBoostingClassifier ya se ha importado por ti.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Instrucciones del ejercicio

Crea una lista learning_rates con las tasas de aprendizaje y una results_list para guardar el accuracy de tus predicciones.
Escribe un bucle que cree un modelo GBM para cada tasa de aprendizaje mencionada y genere predicciones para cada modelo.
Guarda la tasa de aprendizaje y el accuracy en results_list.
Convierte la lista de resultados en un DataFrame e imprímelo.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Set the learning rates & results storage
learning_rates = ____
results_list = ____

# Create the for loop to evaluate model predictions for each learning rate
for learning_rate in ____:
    model = ____(learning_rate=____)
    predictions = ____.fit(____, ____).predict(____)
    # Save the learning rate and accuracy score
    results_list.append([____, accuracy_score(y_test, ____)])

# Gather everything into a DataFrame
results_df = pd.DataFrame(____, columns=['learning_rate', 'accuracy'])
print(results_df)

Editar y ejecutar código

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

IntermedioNivel de habilidad

4.9+

Empieza el curso gratis

En este capítulo introductorio aprenderás la diferencia entre hiperparámetros y parámetros. Practicarás extrayendo y analizando parámetros, y configurando valores de hiperparámetros para varios algoritmos populares de Machine Learning. Por el camino, aprenderás consejos y trucos de buenas prácticas para decidir qué hiperparámetros ajustar, qué valores probar y cómo construir curvas de aprendizaje para analizar tus elecciones.

Exercise 1: Introducción y «parámetros»Exercise 2: Parámetros en la regresión logística Exercise 3: Extraer un parámetro de Logistic Regression Exercise 4: Extraer un parámetro de Random Forest Exercise 5: Introducción a los hiperparámetros Exercise 6: Hiperparámetros en Random Forests Exercise 7: Explorando los hiperparámetros de Random Forest Exercise 8: Hiperparámetros de KNN Exercise 9: Definir y analizar valores de hiperparámetros Exercise 10: Automatizar la elección de hiperparámetros

Ejercicio actual

Exercise 11: Construir curvas de aprendizaje

Este capítulo te presenta una metodología popular de ajuste automático de hiperparámetros llamada Grid Search. Verás qué es, cómo funciona y practicarás cómo realizar un Grid Search con Scikit Learn. Después aprenderás a analizar el resultado de un Grid Search y ganarás experiencia práctica haciéndolo.

Exercise 1: Introducción a Grid Search Exercise 2: Crea funciones de Grid Search Exercise 3: Ajusta iterativamente varios hiperparámetros Exercise 4: ¿Cuántos modelos?Exercise 5: Grid Search con Scikit Learn Exercise 6: Entradas de GridSearchCV Exercise 7: GridSearchCV con Scikit Learn Exercise 8: Entender la salida de una grid search Exercise 9: Usar los mejores resultados Exercise 10: Explorar los resultados del grid search Exercise 11: Analizar los mejores resultados Exercise 12: Usar los mejores resultados

En este capítulo conocerás otra metodología popular de ajuste automático de hiperparámetros llamada Random Search. Verás qué es, cómo funciona y, sobre todo, en qué se diferencia de grid search. Conocerás algunas ventajas e inconvenientes de este método y cuándo elegirlo frente a Grid Search. Practicarás cómo realizar un Random Search con Scikit Learn, además de visualizar e interpretar los resultados.

Exercise 1: Introducción a Random Search Exercise 2: Muestrea hiperparámetros aleatoriamente Exercise 3: Búsqueda aleatoria con Random Forest Exercise 4: Visualizar un Random Search Exercise 5: Random Search en Scikit Learn Exercise 6: Parámetros de RandomSearchCV Exercise 7: El objeto RandomizedSearchCV Exercise 8: RandomSearchCV en Scikit Learn Exercise 9: Comparando Grid Search y Random Search Exercise 10: Comparando Random Search y Grid Search Exercise 11: Búsqueda en cuadrícula y aleatoria, lado a lado

En este capítulo final tendrás una muestra de metodologías más avanzadas de ajuste de hiperparámetros conocidas como "informed search". Incluye una metodología llamada de grueso a fino (Coarse To Fine), así como algoritmos de ajuste bayesianos y genéticos. Verás en qué se diferencia informed search de uninformed search y adquirirás habilidades prácticas con cada una de las metodologías mencionadas, comparándolas sobre la marcha.

Exercise 1: Búsqueda informada: de lo general a lo específico Exercise 2: Visualizar Coarse to Fine Exercise 3: Iteraciones de Coarse to Fine Exercise 4: Búsqueda informada: estadística bayesiana Exercise 5: Regla de Bayes en Python Exercise 6: Ajuste bayesiano de hiperparámetros con Hyperopt Exercise 7: Búsqueda informada: algoritmos genéticos Exercise 8: Ajuste genético de hiperparámetros con TPOT Exercise 9: Analizando la estabilidad de TPOT Exercise 10: ¡Enhorabuena!