1. Learn
  2. /
  3. Cursuri
  4. /
  5. Wprowadzenie do PySpark

Connected

exercițiu

Agregacja w RDD

Skoro przeprowadziłeś już analizę z użyciem DataFrames w PySpark, czas na podobne zadanie z RDD. Korzystając z dostarczonego kodu, oblicz sumę wartości RDD w PySpark.

Sesja Spark o nazwie spark została już utworzona.

Instrucțiuni

100 XP
  • Utwórz RDD na podstawie dostarczonego DataFrame.
  • Zastosuj dostarczoną funkcję Lambda do kluczy RDD.
  • Zbierz wyniki agregacji.