1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

综合练习 II

创建一个 DataFrame,进行一系列转换,将其缓存,并检查它是否已被缓存。然后,取消缓存以释放内存。 本练习已为您提供 spark 会话!请仔细查看 .explain() 方法的输出,以理解最终的执行计划和结果!

说明

100 XP
  • 缓存 df DataFrame。
  • 使用 .explain() 解释 agg_result DataFrame 的处理过程。
  • 处理完成后对已缓存的 df DataFrame 调用 unpersist 以取消缓存。