Flüge optimieren lineare Regression
Bisher hast du bei der Erstellung deiner Modelle die Standard-Hyper-Parameter verwendet. In dieser Übung verwendest du die Kreuzvalidierung, um einen optimalen (oder nahezu optimalen) Satz von Modell-Hyperparametern auszuwählen.
Die folgenden sind bereits erstellt worden:
regression
- einLinearRegression
Objektpipeline
- eine Pipeline mit String-Indexer, One-Hot-Encoder, Vektor-Assembler und linearer Regression undevaluator
- einRegressionEvaluator
Objekt.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Anleitung zur Übung
- Erstelle einen Parameter Grid Builder.
- Füge Raster für mit
regression.regParam
(Werte 0,01, 0,1, 1,0 und 10,0) undregression.elasticNetParam
(Werte 0,0, 0,5 und 1,0) hinzu. - Baue das Gitter auf.
- Erstelle einen Kreuzvalidierer, indem du fünf Faltungen angibst.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)