Bouw een Decision Tree
Nu je de vluchtgegevens hebt opgesplitst in trainings- en testsets, kun je de trainingsset gebruiken om een Decision Tree-model te fitten.
De gegevens zijn beschikbaar als flights_train en flights_test.
LET OP: Het trainen van het model duurt een paar seconden… even geduld!
Deze oefening maakt deel uit van de cursus
Machine Learning met PySpark
Oefeninstructies
- Importeer de klasse om een Decision Tree-classifier te maken.
- Maak een classifier-object en fit dit op de trainingsgegevens.
- Maak voorspellingen voor de testgegevens en bekijk de voorspellingen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)