Aan de slagGa gratis aan de slag

Normale joins

Je hebt twee DataFrames gekregen die je moet samenvoegen tot één bruikbare DataFrame. Je eerste taak is om de DataFrames op een normale manier te combineren en het uitvoeringsplan te bekijken.

De DataFrames flights_df en airports_df zijn voor je beschikbaar.

Deze oefening maakt deel uit van de cursus

Data opschonen met PySpark

Cursus bekijken

Oefeninstructies

  • Maak een nieuwe DataFrame normal_df door flights_df te joinen met airports_df.
  • Bepaal welk type join in het queryplan wordt gebruikt.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
    flights_df["Destination Airport"] == airports_df["IATA"] )

# Show the query plan
normal_df.____()
Code bewerken en uitvoeren