1. Учиться
  2. /
  3. Courses
  4. /
  5. PySpark入門

Connected

Exercise

RDDの作成

PySparkでは、RDD(Resilient Distributed Dataset)はいくつかの方法で作成できます。ここでは、すでにDataFrameに慣れていることを踏まえ、DataFrameを使ってセットアップします。作業環境には、すでに spark という SparkSession が用意されていることを覚えておいてください。

Инструкции

100 XP
  • 提供されたリストからDataFrameを作成し、名前を df とします。
  • そのDataFrameをRDDに変換します。
  • 変換後のRDDをcollectして出力します。