1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Totul împreună II

Creează un DataFrame, aplică transformări, memorează-l în cache și verifică dacă este stocat. Apoi, elimină-l din cache pentru a elibera memoria. Pentru acest exercițiu, sesiunea spark a fost deja creată! Urmărește cu atenție rezultatul metodei .explain() pentru a înțelege ce se întâmplă!

Instrucțiuni

100 XP
  • Memorează în cache DataFrame-ul df.
  • Explică procesarea DataFrame-ului agg_result.
  • Elimină din cache DataFrame-ul df după procesare.