S’entraîner au caching : tout rassembler
Quelle était la meilleure approche pour mettre df1 et df2 en cache, et pourquoi ?
Vos résultats peuvent varier ; voici toutefois un (unique) résultat aléatoire pour chacune des deux approches :
Première réponse (mettre df1 en cache) :
df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9
Deuxième réponse (mettre df2 en cache) :
df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4
Cet exercice fait partie du cours
Introduction à Spark SQL en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice