Esegui il fit del/dei modello/i
Finalmente sei prontə per eseguire il fit dei modelli e selezionare il migliore!
Purtroppo, la cross validation è una procedura molto pesante dal punto di vista computazionale. Addestrare tutti i modelli richiederebbe troppo tempo su DataCamp.
In locale useresti questo codice:
# Fit cross validation models
models = cv.fit(training)
# Extract the best model
best_lr = models.bestModel
Ricorda: i dati di training si chiamano training e stai usando lr per addestrare un modello di regressione logistica. La cross validation ha selezionato come migliori i valori dei parametri regParam=0 ed elasticNetParam=0. Questi sono i valori predefiniti, quindi non devi fare altro con lr prima di effettuare il fit del modello.
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Crea
best_lrchiamandolr.fit()sui datitraining. - Stampa
best_lrper verificare che sia un oggetto della classeLogisticRegressionModel.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Call lr.fit()
best_lr = ____
# Print best_lr
print(____)