Aan de slagBegin gratis

Oefen met het lezen van queryplannen 2

Er zijn drie dataframes beschikbaar: part2_df, part3_df en part4_df. De vragen in deze oefening kun je beantwoorden door de uitvoer van explain() van elk dataframe te bekijken.

Let op dat Spark elke kolomnaam tagt met een descriptor, gescheiden door een #-symbool. Bijvoorbeeld word#0, id#1L, part#2 en title#3. Voor deze oefening kun je deze descriptors negeren.

Deze oefening maakt deel uit van de cursus

Introductie tot Spark SQL in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening