1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to PySpark

Connected

cvičení

Pandas UDF

Toto cvičení se zaměřuje na pandas UDF — procvičíš si jejich syntaxi! Při práci si všimni rozdílů mezi PySpark UDF z předchozího cvičení a tímto typem UDF.

Mimochodem, v tvém pracovním prostředí už je připravená SparkSession s názvem spark!

Pokyny

100 XP
  • Definuj funkci add_ten_pandas() jako pandas UDF.
  • Přidej do DataFrame nový sloupec s názvem "10_plus", který aplikuje pandas UDF na sloupec "value" z df.
  • Zobraz výsledný DataFrame.