1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Procvičení cachování: SQL

V předchozím cvičení jsme prozkoumali dva dataframy: df1 a df2 (který vznikl z df1). Zkusili jsme cachovat df1, ale ne df2. V tomto cvičení se podíváme na efekty cachování df2 bez cachování df1.

Opět si všímej, jak dlouho trvá každá akce. V dalším cvičení je budeme porovnávat. Které úlohy se zrychlily? Které se zpomalily?

Pokyny

100 XP
  • Cachuj df2, ale ne df1.
  • Spusť první akci na df1 a zopakuj ji, pak spusť akci na df2 a zopakuj ji. Tato část je již připravená za tebe.