CommencerCommencer gratuitement

Joints normaux

Vous avez reçu deux DataFrame à combiner en un seul DataFrame utile. Votre première tâche consiste à combiner normalement les DataFrames et à visualiser le plan d'exécution.

Les DataFrame flights_df et airports_df sont à votre disposition.

Cet exercice fait partie du cours

Nettoyer des données avec PySpark

Afficher le cours

Instructions

  • Créez un nouveau DataFrame normal_df en joignant flights_df à airports_df.
  • Déterminez le type de jointure utilisé dans le plan de requête.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
    flights_df["Destination Airport"] == airports_df["IATA"] )

# Show the query plan
normal_df.____()
Modifier et exécuter le code