Aan de slagGa gratis aan de slag

Oefenen met cachen: alles bij elkaar brengen

Wat was de beste aanpak om df1 en df2 te cachen en waarom?

Je resultaten kunnen variëren; maar hier is één (willekeurig) resultaat voor elk van de twee aanpakken:

Eerste antwoord (cache df1):

df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9

Tweede antwoord (cache df2):

df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4

Deze oefening maakt deel uit van de cursus

Introductie tot Spark SQL in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen