Oefen met het lezen van queryplannen 2
Er zijn drie dataframes beschikbaar: part2_df, part3_df en part4_df. De vragen in deze oefening kun je beantwoorden door de uitvoer van explain() van elk dataframe te bekijken.
Let op dat Spark elke kolomnaam tagt met een descriptor, gescheiden door een #-symbool. Bijvoorbeeld word#0, id#1L, part#2 en title#3. Voor deze oefening kun je deze descriptors negeren.
Deze oefening maakt deel uit van de cursus
Introductie tot Spark SQL in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen