CommencerCommencer gratuitement

Optimisation des vols par régression linéaire

Jusqu'à présent, vous avez utilisé les hyperparamètres par défaut lors de la création de vos modèles. Dans cet exercice, vous utiliserez la validation croisée pour sélectionner un ensemble optimal (ou proche de l'optimal) d'hyperparamètres du modèle.

Les éléments suivants ont déjà été créés :

  • regression — un objet d'LinearRegression
  • pipeline — un pipeline avec indexeur de chaînes, encodeur one-hot, assembleur de vecteurs et régression linéaire et
  • evaluator — un objet d'RegressionEvaluator.

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

  • Veuillez créer un générateur de grille de paramètres.
  • Ajoutez des grilles pour « with regression.regParam » (valeurs 0,01, 0,1, 1,0 et 10,0) et « regression.elasticNetParam » (valeurs 0,0, 0,5 et 1,0).
  • Construisez la grille.
  • Créez un validateur croisé en spécifiant cinq plis.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Modifier et exécuter le code