Flüge mit ihren Zielflughäfen verknüpfen
Du wurdest als Data Engineer bei einem globalen Reiseunternehmen eingestellt. Deine erste Aufgabe: Hilf dem Unternehmen, seine Abläufe zu verbessern, indem du Flugdaten analysierst. In deinem Workspace befinden sich zwei Datensätze: einer mit Details zu Flügen (flights) und ein weiterer mit Informationen zu Zielflughäfen (airports). Beide stehen dir zur Verfügung.
Dein Ziel? Kombiniere diese Datensätze, um einen aussagekräftigen Datensatz zu erstellen, der jeden Flug mit seinem Zielflughafen verknüpft.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Untersuche den DataFrame
airports. Notiere dir, welche Schlüsselspalte es ermöglicht,airportsmit der Tabelleflightszu verknüpfen. - Verbinde
flightsmit dem DataFrameairportsüber die Spalte"dest". Speichere das Ergebnis alsflights_with_airports. - Schau dir
flights_with_airportserneut an. Achte auf die neu hinzugefügten Informationen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Examine the data
airports.____()
# .withColumnRenamed() renames the "faa" column to "dest"
airports = airports.withColumnRenamed("faa", "dest")
# Join the DataFrames
flights_with_airports = ____
# Examine the new DataFrame
flights_with_airports.____