ComenzarEmpieza gratis

Automatizar la elección de hiperparámetros

Encontrar el mejor hiperparámetro de interés sin escribir cientos de líneas de código para cientos de modelos es una mejora de eficiencia importante que te ayudará mucho al crear futuros modelos de machine learning.

Un hiperparámetro importante para el algoritmo GBM es la tasa de aprendizaje (learning rate). Pero, ¿qué tasa de aprendizaje es la mejor para este problema? Si escribes un bucle que explore varias posibilidades, las recopiles y las visualices, podrás encontrar la mejor.

Las tasas de aprendizaje que puedes probar incluyen 0.001, 0.01, 0.05, 0.1, 0.2 y 0.5

Tendrás disponibles los conjuntos de datos X_train, X_test, y_train y y_test, y GradientBoostingClassifier ya se ha importado por ti.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Ver curso

Instrucciones del ejercicio

  • Crea una lista learning_rates con las tasas de aprendizaje y una results_list para guardar el accuracy de tus predicciones.
  • Escribe un bucle que cree un modelo GBM para cada tasa de aprendizaje mencionada y genere predicciones para cada modelo.
  • Guarda la tasa de aprendizaje y el accuracy en results_list.
  • Convierte la lista de resultados en un DataFrame e imprímelo.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set the learning rates & results storage
learning_rates = ____
results_list = ____

# Create the for loop to evaluate model predictions for each learning rate
for learning_rate in ____:
    model = ____(learning_rate=____)
    predictions = ____.fit(____, ____).predict(____)
    # Save the learning rate and accuracy score
    results_list.append([____, accuracy_score(y_test, ____)])

# Gather everything into a DataFrame
results_df = pd.DataFrame(____, columns=['learning_rate', 'accuracy'])
print(results_df)
Editar y ejecutar código