Flüge mit ihren Ziel-Flughäfen verknüpfen
Du wurdest als Data Engineer für ein globales Reiseunternehmen eingestellt. Deine erste Aufgabe: Hilf dem Unternehmen, seine Abläufe zu verbessern, indem du Flugdaten analysierst. In deinem Workspace liegen zwei Datensätze bereit: einer mit Details zu Flügen (flights) und ein weiterer mit Informationen zu Zielflughäfen (airports). Beide sind bereits verfügbar.
Dein Ziel? Kombiniere diese Datensätze, um einen aussagekräftigen Datensatz zu erstellen, der jeden Flug seinem Zielflughafen zuordnet.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Untersuche das DataFrame
airports. Achte darauf, welche Schlüsselspalte dir erlaubt,airportsmit der Tabelleflightszu verknüpfen. - Verknüpfe
flightsmit dem DataFrameairportsüber die Spalte"dest". Speichere das Ergebnis alsflights_with_airports. - Untersuche
flights_with_airportserneut. Achte auf die neuen Informationen, die hinzugefügt wurden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Examine the data
airports.____()
# .withColumnRenamed() renames the "faa" column to "dest"
airports = airports.withColumnRenamed("faa", "dest")
# Join the DataFrames
flights_with_airports = ____
# Examine the new DataFrame
flights_with_airports.____