Ottimizzare la regressione lineare sui voli
Finora hai utilizzato gli iperparametri predefiniti per creare i tuoi modelli. In questo esercizio userai la cross validation per scegliere un insieme ottimale (o quasi ottimale) di iperparametri del modello.
Sono già stati creati i seguenti oggetti:
regression— un oggettoLinearRegressionpipeline— una pipeline con string indexer, one-hot encoder, vector assembler e regressione lineare eevaluator— un oggettoRegressionEvaluator.
Questo esercizio fa parte del corso
Machine Learning con PySpark
Istruzioni dell'esercizio
- Crea un builder della griglia dei parametri.
- Aggiungi le griglie per
regression.regParam(valori 0.01, 0.1, 1.0 e 10.0) eregression.elasticNetParam(valori 0.0, 0.5 e 1.0). - Costruisci la griglia.
- Crea un validatore incrociato specificando cinque fold.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)