IniziaInizia gratis

Ottimizzare la regressione lineare sui voli

Finora hai utilizzato gli iperparametri predefiniti per creare i tuoi modelli. In questo esercizio userai la cross validation per scegliere un insieme ottimale (o quasi ottimale) di iperparametri del modello.

Sono già stati creati i seguenti oggetti:

  • regression — un oggetto LinearRegression
  • pipeline — una pipeline con string indexer, one-hot encoder, vector assembler e regressione lineare e
  • evaluator — un oggetto RegressionEvaluator.

Questo esercizio fa parte del corso

Machine Learning con PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un builder della griglia dei parametri.
  • Aggiungi le griglie per regression.regParam (valori 0.01, 0.1, 1.0 e 10.0) e regression.elasticNetParam (valori 0.0, 0.5 e 1.0).
  • Costruisci la griglia.
  • Crea un validatore incrociato specificando cinque fold.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Modifica ed esegui il codice