CommencerCommencez gratuitement

S’entraîner à lire des plans de requête 2

Trois DataFrames sont disponibles : part2_df, part3_df et part4_df. Les questions de cet exercice peuvent être résolues en inspectant la sortie de explain() pour chaque DataFrame.

Notez que Spark annote chaque nom de colonne avec un descripteur, délimité par un symbole #. Par exemple, word#0, id#1L, part#2 et title#3. Pour les besoins de cet exercice, vous pouvez ignorer ces descripteurs.

Cet exercice fait partie du cours

<cours>Introduction à Spark SQL en Python</cours>
Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice