ComenzarEmpieza gratis

Optimización de vuelos de regresión lineal

Hasta ahora has estado utilizando los hiperparámetros por defecto al construir tus modelos. En este ejercicio utilizarás la validación cruzada para elegir un conjunto óptimo (o casi óptimo) de hiperparámetros del modelo.

Ya se han creado los siguientes:

  • regression - un objeto LinearRegression
  • pipeline - un pipeline con indexador de cadenas, codificador de un punto, ensamblador de vectores y regresión lineal y
  • evaluator - un objeto RegressionEvaluator.

Este ejercicio forma parte del curso

Machine learning con PySpark

Ver curso

Instrucciones del ejercicio

  • Crea un constructor de cuadrícula de parámetros.
  • Añade parrillas para con regression.regParam (valores 0,01, 0,1, 1,0 y 10,0) y regression.elasticNetParam (valores 0,0, 0,5 y 1,0).
  • Construye la parrilla.
  • Crea un validador cruzado, especificando cinco pliegues.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Editar y ejecutar código