1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark 입문

Connected

연습 문제

RDD 생성하기

PySpark에서는 RDD(Resilient Distributed Dataset)를 여러 방법으로 만들 수 있어요. 이미 DataFrame에 익숙하시니, 이번에는 DataFrame을 사용해 RDD를 만들어 보겠습니다. 작업 공간에는 이미 spark라는 SparkSession이 준비되어 있어요!

지침

100 XP
  • 제공된 리스트로부터 df라는 DataFrame을 만드세요.
  • DataFrame을 RDD로 변환하세요.
  • 결과 RDD를 collect한 뒤 출력하세요.