Construir curvas de aprendizaje

Si queremos probar muchos valores diferentes para un único hiperparámetro, puede ser difícil verlo de forma clara en un DataFrame. Antes aprendiste un truco útil para analizar esto. Un gráfico llamado “curva de aprendizaje” muestra muy bien el efecto de aumentar o disminuir un hiperparámetro concreto en el resultado final.

En lugar de probar solo unos pocos valores para la tasa de aprendizaje, vas a probar muchos para ver fácilmente el efecto de este hiperparámetro en un amplio rango de valores. Una función útil de NumPy es np.linspace(start, end, num), que te permite crear una cantidad de valores (num) distribuidos de forma uniforme dentro de un intervalo (start, end) que especifiques.

Tendrás disponibles los conjuntos de datos X_train, X_test, y_train y y_test.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Instrucciones del ejercicio

Crea una lista de 30 tasas de aprendizaje, distribuidas uniformemente entre 0.01 y 2.
Crea un bucle similar al del ejercicio anterior, pero guarda solo las puntuaciones de exactitud en una lista.
Dibuja las tasas de aprendizaje frente a la puntuación de exactitud.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Set the learning rates & accuracies list
learn_rates = np.linspace(____, ____, num=____)
accuracies = []

# Create the for loop
for learn_rate in learn_rates:
  	# Create the model, predictions & save the accuracies as before
    model = GradientBoostingClassifier(learning_rate=____)
    predictions = model.fit(____, ____).predict(____)
    accuracies.append(accuracy_score(y_test, ____))

# Plot results    
plt.plot(____, ____)
plt.gca().set(xlabel='learning_rate', ylabel='Accuracy', title='Accuracy for different learning_rates')
plt.____

Editar y ejecutar código

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

IntermedioNivel de habilidad

4.9+

Empieza el curso gratis

En este capítulo introductorio aprenderás la diferencia entre hiperparámetros y parámetros. Practicarás extrayendo y analizando parámetros, y configurando valores de hiperparámetros para varios algoritmos populares de Machine Learning. Por el camino, aprenderás consejos y trucos de buenas prácticas para decidir qué hiperparámetros ajustar, qué valores probar y cómo construir curvas de aprendizaje para analizar tus elecciones.

Exercise 1: Introducción y «parámetros»Exercise 2: Parámetros en la regresión logística Exercise 3: Extraer un parámetro de Logistic Regression Exercise 4: Extraer un parámetro de Random Forest Exercise 5: Introducción a los hiperparámetros Exercise 6: Hiperparámetros en Random Forests Exercise 7: Explorando los hiperparámetros de Random Forest Exercise 8: Hiperparámetros de KNN Exercise 9: Definir y analizar valores de hiperparámetros Exercise 10: Automatizar la elección de hiperparámetros Exercise 11: Construir curvas de aprendizaje

Ejercicio actual

Este capítulo te presenta una metodología popular de ajuste automático de hiperparámetros llamada Grid Search. Verás qué es, cómo funciona y practicarás cómo realizar un Grid Search con Scikit Learn. Después aprenderás a analizar el resultado de un Grid Search y ganarás experiencia práctica haciéndolo.

Exercise 1: Introducción a Grid Search Exercise 2: Crea funciones de Grid Search Exercise 3: Ajusta iterativamente varios hiperparámetros Exercise 4: ¿Cuántos modelos?Exercise 5: Grid Search con Scikit Learn Exercise 6: Entradas de GridSearchCV Exercise 7: GridSearchCV con Scikit Learn Exercise 8: Entender la salida de una grid search Exercise 9: Usar los mejores resultados Exercise 10: Explorar los resultados del grid search Exercise 11: Analizar los mejores resultados Exercise 12: Usar los mejores resultados

En este capítulo conocerás otra metodología popular de ajuste automático de hiperparámetros llamada Random Search. Verás qué es, cómo funciona y, sobre todo, en qué se diferencia de grid search. Conocerás algunas ventajas e inconvenientes de este método y cuándo elegirlo frente a Grid Search. Practicarás cómo realizar un Random Search con Scikit Learn, además de visualizar e interpretar los resultados.

Exercise 1: Introducción a Random Search Exercise 2: Muestrea hiperparámetros aleatoriamente Exercise 3: Búsqueda aleatoria con Random Forest Exercise 4: Visualizar un Random Search Exercise 5: Random Search en Scikit Learn Exercise 6: Parámetros de RandomSearchCV Exercise 7: El objeto RandomizedSearchCV Exercise 8: RandomSearchCV en Scikit Learn Exercise 9: Comparando Grid Search y Random Search Exercise 10: Comparando Random Search y Grid Search Exercise 11: Búsqueda en cuadrícula y aleatoria, lado a lado

En este capítulo final tendrás una muestra de metodologías más avanzadas de ajuste de hiperparámetros conocidas como "informed search". Incluye una metodología llamada de grueso a fino (Coarse To Fine), así como algoritmos de ajuste bayesianos y genéticos. Verás en qué se diferencia informed search de uninformed search y adquirirás habilidades prácticas con cada una de las metodologías mencionadas, comparándolas sobre la marcha.

Exercise 1: Búsqueda informada: de lo general a lo específico Exercise 2: Visualizar Coarse to Fine Exercise 3: Iteraciones de Coarse to Fine Exercise 4: Búsqueda informada: estadística bayesiana Exercise 5: Regla de Bayes en Python Exercise 6: Ajuste bayesiano de hiperparámetros con Hyperopt Exercise 7: Búsqueda informada: algoritmos genéticos Exercise 8: Ajuste genético de hiperparámetros con TPOT Exercise 9: Analizando la estabilidad de TPOT Exercise 10: ¡Enhorabuena!