Joints normaux
Vous avez reçu deux DataFrame à combiner en un seul DataFrame utile. Votre première tâche consiste à combiner normalement les DataFrames et à visualiser le plan d'exécution.
Les DataFrame flights_df
et airports_df
sont à votre disposition.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Créez un nouveau DataFrame
normal_df
en joignantflights_df
àairports_df
. - Déterminez le type de jointure utilisé dans le plan de requête.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()