1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to PySpark

Connected

cvičení

Agregace v RDD

Teď, když jsi pracoval/a s analýzou dat pomocí DataFrames v PySparku, zkusíme podobný úkol s RDD. Pomocí připraveného kódu zjisti součet hodnot RDD v PySparku.

Spark session s názvem spark je již připravena.

Pokyny

100 XP
  • Vytvoř RDD z připraveného DataFrame.
  • Aplikuj připravenou Lambda funkci na klíče RDD.
  • Získej výsledky agregace pomocí collect.