Oefenen met cachen: alles bij elkaar brengen
Wat was de beste aanpak om df1 en df2 te cachen en waarom?
Je resultaten kunnen variëren; maar hier is één (willekeurig) resultaat voor elk van de twee aanpakken:
Eerste antwoord (cache df1):
df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9
Tweede antwoord (cache df2):
df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4
Deze oefening maakt deel uit van de cursus
Introductie tot Spark SQL in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen