LoslegenKostenlos starten

Flugdauer-Modell: Einfach Abstand

In dieser Übung erstellst du ein Regressionsmodell zur Vorhersage der Flugdauer (die Spalte duration ).

Für den Moment hältst du das Modell einfach und nimmst nur die Entfernung des Fluges (die Spalte km ) als Prädiktor.

Die Daten sind unter flights zu finden. Die ersten paar Datensätze werden im Terminal angezeigt. Diese Daten wurden ebenfalls in Trainings- und Testsets aufgeteilt und sind als flights_train und flights_test verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen mit PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle ein Objekt für die lineare Regression. Gib den Namen der Beschriftungsspalte an. Passe ihn an die Trainingsdaten an.
  • Mache Vorhersagen anhand der Testdaten.
  • Erstelle ein Regressionsauswertungsobjekt und verwende es, um den RMSE für die Testdaten auszuwerten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from pyspark.ml.regression import LinearRegression
from pyspark.ml.evaluation import RegressionEvaluator

# Create a regression object and train on training data
regression = ____(____).____(____)

# Create predictions for the testing data and take a look at the predictions
predictions = ____.____(____)
predictions.select('duration', 'prediction').show(5, False)

# Calculate the RMSE
____(____).____(predictions)
Code bearbeiten und ausführen