LoslegenKostenlos loslegen

Flüge mit ihren Ziel-Flughäfen verknüpfen

Du wurdest als Data Engineer für ein globales Reiseunternehmen eingestellt. Deine erste Aufgabe: Hilf dem Unternehmen, seine Abläufe zu verbessern, indem du Flugdaten analysierst. In deinem Workspace liegen zwei Datensätze bereit: einer mit Details zu Flügen (flights) und ein weiterer mit Informationen zu Zielflughäfen (airports). Beide sind bereits verfügbar.

Dein Ziel? Kombiniere diese Datensätze, um einen aussagekräftigen Datensatz zu erstellen, der jeden Flug seinem Zielflughafen zuordnet.

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Untersuche das DataFrame airports. Achte darauf, welche Schlüsselspalte dir erlaubt, airports mit der Tabelle flights zu verknüpfen.
  • Verknüpfe flights mit dem DataFrame airports über die Spalte "dest". Speichere das Ergebnis als flights_with_airports.
  • Untersuche flights_with_airports erneut. Achte auf die neuen Informationen, die hinzugefügt wurden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Examine the data
airports.____()

# .withColumnRenamed() renames the "faa" column to "dest"
airports = airports.withColumnRenamed("faa", "dest")

# Join the DataFrames
flights_with_airports = ____

# Examine the new DataFrame
flights_with_airports.____
Code bearbeiten und ausführen