1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

PySpark の UDF における整数の扱い

この演習では UDF を扱い、PySpark での関数作成を理解します。取り組みながら、データクレンジングのワークフローで何を置き換えられるかを意識してみてください。

作業スペースには、すでに SparkSession の spark が用意されています!

指示

100 XP
  • 関数 age_category を UDF として登録し、age_category_udf という名前を付けてください。
  • DataFrame df に新しい列 "category" を追加し、UDF を適用して年齢に基づいて人を分類してください。age_category_udf() の引数はすでに用意されています。
  • 結果の DataFrame を表示してください。