S’entraîner à lire des plans de requête 2
Trois DataFrames sont disponibles : part2_df, part3_df et part4_df. Les questions de cet exercice peuvent être résolues en inspectant la sortie de explain() pour chaque DataFrame.
Notez que Spark annote chaque nom de colonne avec un descripteur, délimité par un symbole #. Par exemple, word#0, id#1L, part#2 et title#3. Pour les besoins de cet exercice, vous pouvez ignorer ces descripteurs.
Cet exercice fait partie du cours
Introduction à Spark SQL en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice