CommencerCommencer gratuitement

S’entraîner au caching : tout rassembler

Quelle était la meilleure approche pour mettre df1 et df2 en cache, et pourquoi ?

Vos résultats peuvent varier ; voici toutefois un (unique) résultat aléatoire pour chacune des deux approches :

Première réponse (mettre df1 en cache) :

df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9

Deuxième réponse (mettre df2 en cache) :

df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4

Cet exercice fait partie du cours

Introduction à Spark SQL en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice