ComenzarEmpieza gratis

Ajustar los modelos

¡Por fin estás listo para ajustar los modelos y seleccionar el mejor!

Por desgracia, la validación cruzada es un procedimiento muy intensivo desde el punto de vista informático. Ajustar todos los modelos llevaría demasiado tiempo en DataCamp.

Para hacerlo localmente utilizarías el código:

# Fit cross validation models
models = cv.fit(training)

# Extract the best model
best_lr = models.bestModel

Recuerda que los datos de entrenamiento se llaman training y que estás utilizando lr para ajustar un modelo de regresión logística. La validación cruzada seleccionó los valores de los parámetros regParam=0 y elasticNetParam=0 como los mejores. Estos son los valores por defecto, así que no necesitas hacer nada más con lr antes de ajustar el modelo.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Crea best_lr llamando a lr.fit() con los datos de training.
  • Imprime best_lr para verificar que es un objeto de la clase LogisticRegressionModel.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Call lr.fit()
best_lr = ____

# Print best_lr
print(____)
Editar y ejecutar código