Construire un arbre décisionnel
Maintenant que vous avez divisé les données relatives aux vols en ensembles d'entraînement et de test, vous pouvez utiliser l'ensemble d'entraînement pour ajuster un modèle d'arbre de décision.
Les données sont disponibles aux adresses suivantes : flights_train
et flights_test
.
REMARQUE : L'entraînement du modèle prendra quelques secondes… Veuillez patienter !
Cet exercice fait partie du cours
Apprentissage automatique avec PySpark
Instructions
- Importez la classe permettant de créer un classificateur d'arbre de décision.
- Créez un objet classificateur et adaptez-le aux données d'apprentissage.
- Effectuez des prédictions pour les données de test et examinez les résultats.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)