Esercizio sul caching: mettiamo tutto insieme
Qual è stato l'approccio migliore per mettere in cache df1 e df2 e perché?
I tuoi risultati possono variare; ecco però un (casuale) risultato per ciascuno dei due approcci:
Prima risposta (cache df1):
df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9
Seconda risposta (cache df2):
df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio