LoslegenKostenlos starten

Normale Joins

Du hast zwei DataFrames erhalten, die zu einem einzigen, hilfreichen DataFrame kombiniert werden sollen. Deine erste Aufgabe ist es, die DataFrames normal zu verbinden und den Ausführungsplan anzusehen.

Die DataFrames flights_df und airports_df stehen dir zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Datenbereinigung mit PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle einen neuen DataFrame normal_df, indem du flights_df mit airports_df verbindest.
  • Bestimme, welcher Join-Typ im Abfrageplan verwendet wird.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
    flights_df["Destination Airport"] == airports_df["IATA"] )

# Show the query plan
normal_df.____()
Code bearbeiten und ausführen