Optimisation de la régression linéaire des vols
Jusqu'à présent, vous avez utilisé les hyperparamètres par défaut lors de la construction de vos modèles. Dans cet exercice, vous utiliserez la validation croisée pour choisir un ensemble optimal (ou proche de l'être) d'hyperparamètres du modèle.
Les éléments suivants ont déjà été créés :
regression- un objetLinearRegressionpipeline- un pipeline avec indexeur de chaînes de caractères, codeur à un point, assembleur de vecteurs et régression linéaire etevaluator- un objetRegressionEvaluator.
Cet exercice fait partie du cours
Apprentissage automatique avec PySpark
Instructions
- Créez un constructeur de grille de paramètres.
- Ajoutez des grilles pour
regression.regParam(valeurs 0,01, 0,1, 1,0 et 10,0) etregression.elasticNetParam(valeurs 0,0, 0,5 et 1,0). - Construisez la grille.
- Créez un validateur croisé, en spécifiant cinq plis.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)