Einen Entscheidungsbaum erstellen
Nachdem du die Flugdaten in einen Trainings- und einen Testsatz aufgeteilt hast, kannst du den Trainingssatz verwenden, um ein Entscheidungsbaummodell zu erstellen.
Die Daten sind als flights_train
und flights_test
verfügbar.
HINWEIS: Es wird ein paar Sekunden dauern, bis das Modell trainiert ist… bitte habe Geduld!
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Anleitung zur Übung
- Importiere die Klasse für die Erstellung eines Entscheidungsbaum-Klassifikators.
- Erstelle ein Klassifizierungsobjekt und passe es an die Trainingsdaten an.
- Mache Vorhersagen für die Testdaten und schaue dir die Vorhersagen an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)