학습

/

강의

/

Python에서 Spark SQL 입문

Connected

연습 문제

캐싱 연습: SQL

앞서 df1과 df1에서 만들어진 df2라는 두 개의 DataFrame을 살펴봤습니다. 그때는 df1만 캐싱하고 df2는 캐싱하지 않았죠. 이번 연습에서는 반대로 df2를 캐싱하고 df1은 캐싱하지 않았을 때의 효과를 살펴보겠습니다.

각 작업에 걸리는 시간을 다시 기록해 보세요. 다음 연습 문제에서 비교해 볼 예정입니다. 어떤 작업이 더 빨라졌나요? 어떤 작업은 오히려 느려졌나요?

지침

100 XP

df1은 캐싱하지 않고 df2만 캐싱하세요.
df1에서 액션을 한 번 실행하고 반복한 뒤, df2에서도 액션을 실행하고 반복하세요. 이 부분은 미리 작성되어 있습니다.