LoslegenKostenlos starten

Flüge mit ihren Zielflughäfen verknüpfen

Du wurdest als Data Engineer bei einem globalen Reiseunternehmen eingestellt. Deine erste Aufgabe: Hilf dem Unternehmen, seine Abläufe zu verbessern, indem du Flugdaten analysierst. In deinem Workspace befinden sich zwei Datensätze: einer mit Details zu Flügen (flights) und ein weiterer mit Informationen zu Zielflughäfen (airports). Beide stehen dir zur Verfügung.

Dein Ziel? Kombiniere diese Datensätze, um einen aussagekräftigen Datensatz zu erstellen, der jeden Flug mit seinem Zielflughafen verknüpft.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Untersuche den DataFrame airports. Notiere dir, welche Schlüsselspalte es ermöglicht, airports mit der Tabelle flights zu verknüpfen.
  • Verbinde flights mit dem DataFrame airports über die Spalte "dest". Speichere das Ergebnis als flights_with_airports.
  • Schau dir flights_with_airports erneut an. Achte auf die neu hinzugefügten Informationen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Examine the data
airports.____()

# .withColumnRenamed() renames the "faa" column to "dest"
airports = airports.withColumnRenamed("faa", "dest")

# Join the DataFrames
flights_with_airports = ____

# Examine the new DataFrame
flights_with_airports.____
Code bearbeiten und ausführen