Linear regression voor vluchten optimaliseren
Tot nu toe heb je bij het bouwen van je modellen de standaard hyperparameters gebruikt. In deze oefening gebruik je cross-validatie om een optimale (of bijna optimale) set hyperparameters voor je model te kiezen.
De volgende objecten zijn al gemaakt:
regression— eenLinearRegression-objectpipeline— een pipeline met string indexer, one-hot encoder, vector assembler en linear regression, enevaluator— eenRegressionEvaluator-object.
Deze oefening maakt deel uit van de cursus
Machine Learning met PySpark
Oefeninstructies
- Maak een parameter grid builder.
- Voeg grids toe voor
regression.regParam(waarden 0.01, 0.1, 1.0 en 10.0) enregression.elasticNetParam(waarden 0.0, 0.5 en 1.0). - Bouw het grid.
- Maak een cross-validator met vijf folds.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)