CommencerCommencer gratuitement

S’entraîner à lire des plans de requête 2

Trois DataFrames sont disponibles : part2_df, part3_df et part4_df. Les questions de cet exercice peuvent être résolues en inspectant la sortie de explain() pour chaque DataFrame.

Notez que Spark annote chaque nom de colonne avec un descripteur, délimité par un symbole #. Par exemple, word#0, id#1L, part#2 et title#3. Pour les besoins de cet exercice, vous pouvez ignorer ces descripteurs.

Cet exercice fait partie du cours

Introduction à Spark SQL en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice