LoslegenKostenlos loslegen

Flüge optimieren lineare Regression

Bisher hast du bei der Erstellung deiner Modelle die Standard-Hyper-Parameter verwendet. In dieser Übung verwendest du die Kreuzvalidierung, um einen optimalen (oder nahezu optimalen) Satz von Modell-Hyperparametern auszuwählen.

Die folgenden sind bereits erstellt worden:

  • regression - ein LinearRegression Objekt
  • pipeline - eine Pipeline mit String-Indexer, One-Hot-Encoder, Vektor-Assembler und linearer Regression und
  • evaluator - ein RegressionEvaluator Objekt.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen Parameter Grid Builder.
  • Füge Raster für mit regression.regParam (Werte 0,01, 0,1, 1,0 und 10,0) und regression.elasticNetParam (Werte 0,0, 0,5 und 1,0) hinzu.
  • Baue das Gitter auf.
  • Erstelle einen Kreuzvalidierer, indem du fünf Faltungen angibst.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Code bearbeiten und ausführen