CommencerCommencer gratuitement

Construire un arbre de décision

Maintenant que vous avez divisé les données des vols en ensembles de formation et de test, vous pouvez utiliser l'ensemble de formation pour ajuster un modèle d'arbre de décision.

Les données sont disponibles sur les sites flights_train et flights_test.

NOTE : Il faudra quelques secondes au modèle pour s'entraîner… soyez patient !

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

  • Importez la classe permettant de créer un classificateur d'arbre de décision.
  • Créez un objet classificateur et adaptez-le aux données d'apprentissage.
  • Faites des prédictions pour les données du test et examinez les prédictions.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____

# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)

# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)
Modifier et exécuter le code