1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

创建 RDD

在 PySpark 中,您可以通过多种方式创建 RDD(Resilient Distributed Dataset,弹性分布式数据集)。由于您已经熟悉 DataFrame,本题将基于 DataFrame 来进行。请记住,您的工作区中已经有一个名为 spark 的 SparkSession!

说明

100 XP
  • 使用提供的列表创建一个名为 df 的 DataFrame。
  • 将该 DataFrame 转换为 RDD。
  • 收集并打印得到的 RDD。