Aan de slagBegin gratis

Oefenen met cachen: alles bij elkaar brengen

Wat was de beste aanpak om df1 en df2 te cachen en waarom?

Je resultaten kunnen variëren; maar hier is één (willekeurig) resultaat voor elk van de twee aanpakken:

Eerste antwoord (cache df1):

df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9

Tweede antwoord (cache df2):

df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4

Deze oefening maakt deel uit van de cursus

Introductie tot Spark SQL in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening