1. Learn
  2. /
  3. Courses
  4. /
  5. PySpark入門

Connected

Exercise

PySpark での集計

いよいよ自分で集計をしてみましょう! これまでに使った給与データセットを引き続き使用します。どんな集計が作れるか試してみましょう。 作業スペースには、spark という SparkSession と、Spark DataFrame の salaries_df があらかじめ用意されています。

Instructions

100 XP
  • US の Small 企業における最小の給与を求めてください。フィルタリングは SQL 文字列を渡さず、列を直接参照して行います("salary_in_usd")。
  • US の Large("L" で表されます)企業における最大の給与を求めてください。こちらも SQL 文字列を渡さず、列を直接参照してフィルタリングします("salary_in_usd")。