CommencerCommencer gratuitement

Optimisation de la régression linéaire des vols

Jusqu'à présent, vous avez utilisé les hyperparamètres par défaut lors de la construction de vos modèles. Dans cet exercice, vous utiliserez la validation croisée pour choisir un ensemble optimal (ou proche de l'être) d'hyperparamètres du modèle.

Les éléments suivants ont déjà été créés :

  • regression - un objet LinearRegression
  • pipeline - un pipeline avec indexeur de chaînes de caractères, codeur à un point, assembleur de vecteurs et régression linéaire et
  • evaluator - un objet RegressionEvaluator.

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

  • Créez un constructeur de grille de paramètres.
  • Ajoutez des grilles pour regression.regParam (valeurs 0,01, 0,1, 1,0 et 10,0) et regression.elasticNetParam (valeurs 0,0, 0,5 et 1,0).
  • Construisez la grille.
  • Créez un validateur croisé, en spécifiant cinq plis.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Modifier et exécuter le code