ComenzarEmpieza gratis

Practicando el caché: juntándolo todo

¿Cuál fue el mejor enfoque para hacer caché de df1 y df2 y por qué?

Tus resultados variarán; pero aquí tienes un resultado (aleatorio) para cada uno de los dos enfoques:

Primera respuesta (cache df1):

df1_1st : 2.4s
df1_2nd : 0.1s
df2_1st : 0.3s
df2_2nd : 0.2s
Overall elapsed : 3.9

Segunda respuesta (cache df2):

df1_1st : 2.3s
df1_2nd : 1.1s
df2_1st : 1.7s
df2_2nd : 0.1s
Overall elapsed : 6.4

Este ejercicio forma parte del curso

Introducción a Spark SQL en Python

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio