1. Учиться
  2. /
  3. Courses
  4. /
  5. PySpark入門

Connected

Exercise

Pandas UDFs

この演習では Pandas UDF を扱い、構文を練習します。進めながら、前の演習で使った PySpark の UDF と今回の UDF の違いに注目してください。

作業環境にはすでに spark という SparkSession が用意されています!

Инструкции

100 XP
  • add_ten_pandas() 関数を pandas UDF として定義します。
  • pandas UDF を DataFrame df の列 "value" に適用し、"10_plus" という新しい列を追加します。
  • 結果の DataFrame を表示します。