Erste SchritteKostenlos loslegen

Normale Fugen

Du hast zwei DataFrames erhalten, die du zu einem einzigen nützlichen DataFrame kombinieren sollst. Deine erste Aufgabe ist es, die DataFrames normal zu kombinieren und den Ausführungsplan zu betrachten.

Die DataFrames flights_df und airports_df stehen dir zur Verfügung.

Diese Übung ist Teil des Kurses

Daten bereinigen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen neuen DataFrame normal_df, indem du flights_df mit airports_df verbindest.
  • Bestimme, welche Art von Join im Abfrageplan verwendet wird.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
    flights_df["Destination Airport"] == airports_df["IATA"] )

# Show the query plan
normal_df.____()
Bearbeiten und Ausführen von Code