Flüge optimieren lineare Regression
Bisher hast du bei der Erstellung deiner Modelle die Standard-Hyper-Parameter verwendet. In dieser Übung verwendest du die Kreuzvalidierung, um einen optimalen (oder nahezu optimalen) Satz von Modell-Hyperparametern auszuwählen.
Die folgenden sind bereits erstellt worden:
regression- einLinearRegressionObjektpipeline- eine Pipeline mit String-Indexer, One-Hot-Encoder, Vektor-Assembler und linearer Regression undevaluator- einRegressionEvaluatorObjekt.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Anleitung zur Übung
- Erstelle einen Parameter Grid Builder.
- Füge Raster für mit
regression.regParam(Werte 0,01, 0,1, 1,0 und 10,0) undregression.elasticNetParam(Werte 0,0, 0,5 und 1,0) hinzu. - Baue das Gitter auf.
- Erstelle einen Kreuzvalidierer, indem du fünf Faltungen angibst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)