Normale Joins
Du hast zwei DataFrames erhalten, die zu einem einzigen, hilfreichen DataFrame kombiniert werden sollen. Deine erste Aufgabe ist es, die DataFrames normal zu verbinden und den Ausführungsplan anzusehen.
Die DataFrames flights_df und airports_df stehen dir zur Verfügung.
Diese Übung ist Teil des Kurses
Datenbereinigung mit PySpark
Anleitung zur Übung
- Erstelle einen neuen DataFrame
normal_df, indem duflights_dfmitairports_dfverbindest. - Bestimme, welcher Join-Typ im Abfrageplan verwendet wird.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()