LoslegenKostenlos loslegen

Normale Joins

Du hast zwei DataFrames erhalten, die zu einem einzigen, hilfreichen DataFrame kombiniert werden sollen. Deine erste Aufgabe ist es, die DataFrames normal zu verbinden und den Ausführungsplan anzusehen.

Die DataFrames flights_df und airports_df stehen dir zur Verfügung.

Diese Übung ist Teil des Kurses

Datenbereinigung mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen neuen DataFrame normal_df, indem du flights_df mit airports_df verbindest.
  • Bestimme, welcher Join-Typ im Abfrageplan verwendet wird.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
    flights_df["Destination Airport"] == airports_df["IATA"] )

# Show the query plan
normal_df.____()
Code bearbeiten und ausführen