1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Agregarea în RDD-uri

Acum că ai realizat analize cu DataFrame-uri în PySpark, să facem o sarcină similară folosind un RDD. Pe baza codului furnizat, calculează suma valorilor unui RDD în PySpark.

O sesiune Spark numită spark a fost deja creată pentru tine.

Instrucțiuni

100 XP
  • Creează un RDD din DataFrame-ul furnizat.
  • Aplică funcția Lambda furnizată asupra cheilor RDD-ului.
  • Colectează rezultatele agregării.