Normale Fugen
Du hast zwei DataFrames erhalten, die du zu einem einzigen nützlichen DataFrame kombinieren sollst. Deine erste Aufgabe ist es, die DataFrames normal zu kombinieren und den Ausführungsplan zu betrachten.
Die DataFrames flights_df
und airports_df
stehen dir zur Verfügung.
Diese Übung ist Teil des Kurses
Daten bereinigen mit PySpark
Anleitung zur Übung
- Erstelle einen neuen DataFrame
normal_df
, indem duflights_df
mitairports_df
verbindest. - Bestimme, welche Art von Join im Abfrageplan verwendet wird.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()