1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

在 RDD 中做聚合

您已经在 PySpark 中用 DataFrame 做过分析。现在让我们用 RDD 做一个类似的小任务。请使用提供的代码,在 PySpark 中计算一个 RDD 的值之和。

名为 spark 的 Spark 会话已为您创建。

说明

100 XP
  • 从提供的 DataFrame 创建一个 RDD。
  • 将提供的 Lambda 函数应用到 RDD 的键上。
  • 收集聚合结果。