1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

在 DataFrame 上使用 SQL 做分析

与 DataFrame 操作相比,SQL 查询更简洁、执行也更容易。但要在 DataFrame 上应用 SQL 查询,您需要先把该 DataFrame 注册成一个临时视图(表),然后再对这个表执行 SQL 查询。

您的工作区中已经提供了 SparkContext spark 和 salaries_df。

说明

100 XP
  • 由 salaries_df DataFrame 创建名为 "salaries_table" 的临时表。
  • 构造一个查询,从 company_location 为加拿大("CA")的记录中提取 "job_title" 列。
  • 运行该 SQL 查询并创建新的 DataFrame canada_titles。
  • 获取该表的汇总信息。