Practicando el caché: juntándolo todo
¿Cuál fue el mejor enfoque para hacer caché de df1 y df2 y por qué?
Tus resultados variarán; pero aquí tienes un resultado (aleatorio) para cada uno de los dos enfoques:
Primera respuesta (cache df1):
df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9
Segunda respuesta (cache df2):
df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4
Este ejercicio forma parte del curso
Introducción a Spark SQL en Python
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio