1. Учиться
  2. /
  3. Courses
  4. /
  5. PySpark로 배우는 빅데이터 기초

Connected

Exercise

CountingBykeys

많은 데이터셋에서는 키/값 데이터셋에서 키의 개수를 세는 일이 중요합니다. 예를 들어, 제품이 판매된 국가 수를 세거나 가장 인기 있는 아기 이름을 보여 주는 경우가 그렇죠. 이 간단한 연습 문제에서는 앞에서 생성한 Rdd를 사용하여 해당 페어 RDD에서 고유 키의 개수를 세어 보겠습니다.

워크스페이스에는 이미 SparkContext sc와 Rdd가 준비되어 있다는 점을 기억하세요.

Инструкции

100 XP
  • countByKey를 사용하고 결과를 변수 total에 할당하세요.
  • total의 타입은 무엇인가요?
  • total을 순회하며 키와 그 개수를 출력하세요.