Entscheidungsbaum erstellen
Nachdem du die Flugdaten in Trainings- und Testdatensätze aufgeteilt hast, kannst du den Trainingsdatensatz verwenden, um ein Entscheidungsbaummodell anzupassen.
Die Daten sind verfügbar unter flights_train
und flights_test
.
HINWEIS: Das Training des Modells dauert ein paar Sekunden… bitte hab etwas Geduld!
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Anleitung zur Übung
- Importiere die Klasse zum Erstellen eines Entscheidungsbaum-Klassifikators.
- Mach ein Klassifizierer-Objekt und passe es an die Trainingsdaten an.
- Mach mal ein paar Vorhersagen für die Testdaten und schau dir die Ergebnisse an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)