Optimisation de la régression linéaire des vols
Jusqu'à présent, vous avez utilisé les hyperparamètres par défaut lors de la construction de vos modèles. Dans cet exercice, vous utiliserez la validation croisée pour choisir un ensemble optimal (ou proche de l'être) d'hyperparamètres du modèle.
Les éléments suivants ont déjà été créés :
regression- un objetLinearRegressionpipeline- un pipeline avec indexeur de chaînes de caractères, codeur à un point, assembleur de vecteurs et régression linéaire etevaluator- un objetRegressionEvaluator.
Cet exercice fait partie du cours
<cours>Apprentissage automatique avec PySpark</cours>Instructions de l’exercice
- Créez un constructeur de grille de paramètres.
- Ajoutez des grilles pour
regression.regParam(valeurs 0,01, 0,1, 1,0 et 10,0) etregression.elasticNetParam(valeurs 0,0, 0,5 et 1,0). - Construisez la grille.
- Créez un validateur croisé, en spécifiant cinq plis.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)