Ajustar los modelos
¡Por fin estás listo para ajustar los modelos y seleccionar el mejor!
Por desgracia, la validación cruzada es un procedimiento muy intensivo desde el punto de vista informático. Ajustar todos los modelos llevaría demasiado tiempo en DataCamp.
Para hacerlo localmente utilizarías el código:
# Fit cross validation models
models = cv.fit(training)
# Extract the best model
best_lr = models.bestModel
Recuerda que los datos de entrenamiento se llaman training
y que estás utilizando lr
para ajustar un modelo de regresión logística. La validación cruzada seleccionó los valores de los parámetros regParam=0
y elasticNetParam=0
como los mejores. Estos son los valores por defecto, así que no necesitas hacer nada más con lr
antes de ajustar el modelo.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Crea
best_lr
llamando alr.fit()
con los datos detraining
. - Imprime
best_lr
para verificar que es un objeto de la claseLogisticRegressionModel
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Call lr.fit()
best_lr = ____
# Print best_lr
print(____)