ComenzarEmpieza gratis

Optimización de vuelos de regresión lineal

Hasta ahora has estado utilizando los hiperparámetros por defecto al construir tus modelos. En este ejercicio utilizarás la validación cruzada para elegir un conjunto óptimo (o casi óptimo) de hiperparámetros del modelo.

Ya se han creado los siguientes:

  • regression - un objeto LinearRegression
  • pipeline - un pipeline con indexador de cadenas, codificador de un punto, ensamblador de vectores y regresión lineal y
  • evaluator - un objeto RegressionEvaluator.

Este ejercicio forma parte del curso

Machine learning con PySpark

Ver curso

Instrucciones de ejercicio

  • Crea un constructor de cuadrícula de parámetros.
  • Añade parrillas para con regression.regParam (valores 0,01, 0,1, 1,0 y 10,0) y regression.elasticNetParam (valores 0,0, 0,5 y 1,0).
  • Construye la parrilla.
  • Crea un validador cruzado, especificando cinco pliegues.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Editar y ejecutar código