LoslegenKostenlos loslegen

Flugdauer-Modell: Einfach Abstand

In dieser Übung erstellst du ein Regressionsmodell zur Vorhersage der Flugdauer (die Spalte duration ).

Für den Moment hältst du das Modell einfach und nimmst nur die Entfernung des Fluges (die Spalte km ) als Prädiktor.

Die Daten sind unter flights zu finden. Die ersten paar Datensätze werden im Terminal angezeigt. Diese Daten wurden ebenfalls in Trainings- und Testsets aufgeteilt und sind als flights_train und flights_test verfügbar.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Objekt für die lineare Regression. Gib den Namen der Beschriftungsspalte an. Passe ihn an die Trainingsdaten an.
  • Mache Vorhersagen anhand der Testdaten.
  • Erstelle ein Regressionsauswertungsobjekt und verwende es, um den RMSE für die Testdaten auszuwerten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from pyspark.ml.regression import LinearRegression
from pyspark.ml.evaluation import RegressionEvaluator

# Create a regression object and train on training data
regression = ____(____).____(____)

# Create predictions for the testing data and take a look at the predictions
predictions = ____.____(____)
predictions.select('duration', 'prediction').show(5, False)

# Calculate the RMSE
____(____).____(predictions)
Code bearbeiten und ausführen