Optimización de vuelos mediante regresión lineal
Hasta ahora, has estado utilizando los hiperparámetros predeterminados al crear tus modelos. En este ejercicio, utilizarás la validación cruzada para elegir un conjunto óptimo (o cercano a lo óptimo) de hiperparámetros del modelo.
Ya se han creado los siguientes:
regression
— un objeto «LinearRegression
»pipeline
— un pipeline con indexador de cadenas, codificador one-hot, ensamblador vectorial y regresión lineal yevaluator
— un objeto «RegressionEvaluator
».
Este ejercicio forma parte del curso
Machine learning con PySpark
Instrucciones del ejercicio
- Crea un generador de cuadrículas de parámetros.
- Añade parrillas para «
regression.regParam
» (valores 0,01, 0,1, 1,0 y 10,0) y «regression.elasticNetParam
» (valores 0,0, 0,5 y 1,0). - Construye la parilla.
- Crea un validador cruzado, especificando cinco pliegues.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)