1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark SQL w Pythonie

Connected

ćwiczenie

Ćwiczenie z cachowaniem: SQL

Wcześniej przyjrzeliśmy się dwóm DataFrame'om: df1 i df2 (który powstaje na podstawie df1). Próbowaliśmy cachować df1, ale nie df2. W tym ćwiczeniu sprawdzimy, co się dzieje, gdy cachujemy df2, ale nie df1.

Zwróć uwagę na czas wykonania poszczególnych akcji. Porównamy te wyniki w kolejnym ćwiczeniu. Które operacje przyspieszyły? Które spowolniały?

Instrukcje

100 XP
  • Cachuj df2, ale nie df1.
  • Uruchom pierwszą akcję na df1 i powtórz ją, a następnie uruchom akcję na df2 i również ją powtórz. Ta część została już za ciebie przygotowana.