1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

PySpark UDF 中的整数

本练习涵盖 UDF,帮助您理解在 PySpark 中创建函数的方式!在完成练习时,请思考它在数据清洗流程中可以替代哪些步骤。

请记住,您的工作区中已经有一个 SparkSession,名称为 spark!

说明

100 XP
  • 将函数 age_category 注册为名为 age_category_udf 的 UDF。
  • 向 DataFrame df 添加一个名为 "category" 的新列,应用该 UDF 按年龄为人群分类。age_category_udf() 的参数已为您提供。
  • 显示结果 DataFrame。