1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark 입문

Connected

演習

RDD 생성하기

PySpark에서는 RDD(Resilient Distributed Dataset)를 여러 방법으로 만들 수 있어요. 이미 DataFrame에 익숙하시니, 이번에는 DataFrame을 사용해 RDD를 만들어 보겠습니다. 작업 공간에는 이미 spark라는 SparkSession이 준비되어 있어요!

指示

100 XP
  • 제공된 리스트로부터 df라는 DataFrame을 만드세요.
  • DataFrame을 RDD로 변환하세요.
  • 결과 RDD를 collect한 뒤 출력하세요.