CommencerCommencer gratuitement

Construire un arbre décisionnel

Maintenant que vous avez divisé les données relatives aux vols en ensembles d'entraînement et de test, vous pouvez utiliser l'ensemble d'entraînement pour ajuster un modèle d'arbre de décision.

Les données sont disponibles aux adresses suivantes : flights_train et flights_test.

REMARQUE : L'entraînement du modèle prendra quelques secondes… Veuillez patienter !

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

  • Importez la classe permettant de créer un classificateur d'arbre de décision.
  • Créez un objet classificateur et adaptez-le aux données d'apprentissage.
  • Effectuez des prédictions pour les données de test et examinez les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____

# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)

# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)
Modifier et exécuter le code