IniziaInizia gratis

Esercizio sul caching: mettiamo tutto insieme

Qual è stato l'approccio migliore per mettere in cache df1 e df2 e perché?

I tuoi risultati possono variare; ecco però un (casuale) risultato per ciascuno dei due approcci:

Prima risposta (cache df1):

df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9

Seconda risposta (cache df2):

df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4

Questo esercizio fa parte del corso

Introduzione a Spark SQL in Python

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio