Flüge mit ihren Zielflughäfen verknüpfen
Du wurdest als Data Engineer bei einem globalen Reiseunternehmen eingestellt. Deine erste Aufgabe: Hilf dem Unternehmen, seine Abläufe zu verbessern, indem du Flugdaten analysierst. In deinem Workspace liegen zwei Datensätze: einer mit Details zu Flügen (flights) und ein weiterer mit Informationen zu Zielflughäfen (airports). Beide sind bereits verfügbar.
Dein Ziel? Kombiniere diese Datensätze, um einen aussagekräftigen Datensatz zu erstellen, der jeden Flug mit seinem Zielflughafen verknüpft.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Untersuche das DataFrame
airports. Notiere dir, welche Schlüsselspalte es ermöglicht,airportsmit der Tabelleflightszu verknüpfen. - Verbinde
flightsmit dem DataFrameairportsüber die Spalte"dest". Speichere das Ergebnis alsflights_with_airports. - Untersuche
flights_with_airportserneut. Achte auf die neu hinzugefügten Informationen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Examine the data
airports.____()
# .withColumnRenamed() renames the "faa" column to "dest"
airports = airports.withColumnRenamed("faa", "dest")
# Join the DataFrames
flights_with_airports = ____
# Examine the new DataFrame
flights_with_airports.____