Entraîner le classifieur
Le dataframe df_trainset que vous avez créé dans l’exercice précédent est disponible. Vous allez maintenant l’utiliser pour entraîner un classifieur de régression logistique.
Cet exercice fait partie du cours
Introduction à Spark SQL en Python
Instructions
- Importez le classifieur de régression logistique.
- Instanciez le classifieur. Définissez le nombre maximal d’itérations à 100, le paramètre de régularisation à 0,4, et le paramètre d’elastic net à 0,0.
- Entraînez le classifieur sur l’ensemble d’entraînement.
- Affichez le nombre d’itérations d’entraînement.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the logistic regression classifier
from ____ import ____
# Instantiate logistic setting elasticnet to 0.0
logistic = ____(maxIter=100, regParam=0.4, ____=0.0)
# Train the logistic classifer on the trainset
df_fitted = ____.____(____)
# Print the number of training iterations
print("Training iterations: ", df_fitted.____.____)