Optimisation des vols par régression linéaire
Jusqu'à présent, vous avez utilisé les hyperparamètres par défaut lors de la création de vos modèles. Dans cet exercice, vous utiliserez la validation croisée pour sélectionner un ensemble optimal (ou proche de l'optimal) d'hyperparamètres du modèle.
Les éléments suivants ont déjà été créés :
regression
— un objet d'LinearRegression
pipeline
— un pipeline avec indexeur de chaînes, encodeur one-hot, assembleur de vecteurs et régression linéaire etevaluator
— un objet d'RegressionEvaluator
.
Cet exercice fait partie du cours
Apprentissage automatique avec PySpark
Instructions
- Veuillez créer un générateur de grille de paramètres.
- Ajoutez des grilles pour « with
regression.regParam
» (valeurs 0,01, 0,1, 1,0 et 10,0) et «regression.elasticNetParam
» (valeurs 0,0, 0,5 et 1,0). - Construisez la grille.
- Créez un validateur croisé en spécifiant cinq plis.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)