ComenzarEmpieza gratis

Optimización de vuelos mediante regresión lineal

Hasta ahora, has estado utilizando los hiperparámetros predeterminados al crear tus modelos. En este ejercicio, utilizarás la validación cruzada para elegir un conjunto óptimo (o cercano a lo óptimo) de hiperparámetros del modelo.

Ya se han creado los siguientes:

  • regression — un objeto « LinearRegression »
  • pipeline — un pipeline con indexador de cadenas, codificador one-hot, ensamblador vectorial y regresión lineal y
  • evaluator — un objeto « RegressionEvaluator ».

Este ejercicio forma parte del curso

Machine learning con PySpark

Ver curso

Instrucciones del ejercicio

  • Crea un generador de cuadrículas de parámetros.
  • Añade parrillas para « regression.regParam » (valores 0,01, 0,1, 1,0 y 10,0) y « regression.elasticNetParam » (valores 0,0, 0,5 y 1,0).
  • Construye la parilla.
  • Crea un validador cruzado, especificando cinco pliegues.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Editar y ejecutar código