CommencerCommencer gratuitement

Entraîner le classifieur

Le dataframe df_trainset que vous avez créé dans l’exercice précédent est disponible. Vous allez maintenant l’utiliser pour entraîner un classifieur de régression logistique.

Cet exercice fait partie du cours

Introduction à Spark SQL en Python

Afficher le cours

Instructions

  • Importez le classifieur de régression logistique.
  • Instanciez le classifieur. Définissez le nombre maximal d’itérations à 100, le paramètre de régularisation à 0,4, et le paramètre d’elastic net à 0,0.
  • Entraînez le classifieur sur l’ensemble d’entraînement.
  • Affichez le nombre d’itérations d’entraînement.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the logistic regression classifier
from ____ import ____

# Instantiate logistic setting elasticnet to 0.0
logistic = ____(maxIter=100, regParam=0.4, ____=0.0)

# Train the logistic classifer on the trainset
df_fitted = ____.____(____)

# Print the number of training iterations
print("Training iterations: ", df_fitted.____.____)
Modifier et exécuter le code