Normale joins
Je hebt twee DataFrames gekregen die je moet samenvoegen tot één bruikbare DataFrame. Je eerste taak is om de DataFrames op een normale manier te combineren en het uitvoeringsplan te bekijken.
De DataFrames flights_df en airports_df zijn voor je beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen met PySpark
Oefeninstructies
- Maak een nieuwe DataFrame
normal_dfdoorflights_dfte joinen metairports_df. - Bepaal welk type join in het queryplan wordt gebruikt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()