1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

推断并筛选

假设您有一个人口普查数据集,且您知道它包含表头并带有模式。让我们加载该数据集,并让 PySpark 推断模式。若按年龄大于 40 岁的成年人进行筛选,您会看到什么?

请记住,您的工作区中已经有一个名为 SparkSession 的 spark!

说明

100 XP
  • 加载 JSON 文件 adults.json。
  • 将数据筛选为仅包含 age 大于 40 的成年人。
  • 显示结果。