Aan de slagGa gratis aan de slag

Bouw een Decision Tree

Nu je de vluchtgegevens hebt opgesplitst in trainings- en testsets, kun je de trainingsset gebruiken om een Decision Tree-model te fitten.

De gegevens zijn beschikbaar als flights_train en flights_test.

LET OP: Het trainen van het model duurt een paar seconden… even geduld!

Deze oefening maakt deel uit van de cursus

Machine Learning met PySpark

Cursus bekijken

Oefeninstructies

  • Importeer de klasse om een Decision Tree-classifier te maken.
  • Maak een classifier-object en fit dit op de trainingsgegevens.
  • Maak voorspellingen voor de testgegevens en bekijk de voorspellingen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____

# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)

# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)
Code bewerken en uitvoeren