Optimización de vuelos de regresión lineal
Hasta ahora has estado utilizando los hiperparámetros por defecto al construir tus modelos. En este ejercicio utilizarás la validación cruzada para elegir un conjunto óptimo (o casi óptimo) de hiperparámetros del modelo.
Ya se han creado los siguientes:
regression
- un objetoLinearRegression
pipeline
- un pipeline con indexador de cadenas, codificador de un punto, ensamblador de vectores y regresión lineal yevaluator
- un objetoRegressionEvaluator
.
Este ejercicio forma parte del curso
Machine learning con PySpark
Instrucciones de ejercicio
- Crea un constructor de cuadrícula de parámetros.
- Añade parrillas para con
regression.regParam
(valores 0,01, 0,1, 1,0 y 10,0) yregression.elasticNetParam
(valores 0,0, 0,5 y 1,0). - Construye la parrilla.
- Crea un validador cruzado, especificando cinco pliegues.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)