1. Uczyć się
  2. /
  3. Courses
  4. /
  5. PySpark 입문

Connected

Exercise

RDD에서 집계하기

이제 PySpark에서 DataFrame으로 분석을 수행해 보았으니, RDD로도 비슷한 작업을 간단히 해 보겠습니다. 제공된 코드를 사용해 PySpark에서 RDD 값의 합계를 구하세요.

spark라는 Spark 세션은 미리 만들어져 있습니다.

Instrukcje

100 XP
  • 제공된 DataFrame에서 RDD를 생성하세요.
  • 제공된 Lambda 함수를 RDD의 키에 적용하세요.
  • 집계 결과를 수집(collect)하세요.