1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Vytvoření UDF pro vektorová data

K dispozici máš dataframe df se sloupcem output typu vector. Jeho prvních pět řádků je zobrazeno v konzoli.

Pokyny

100 XP
  • Vytvoř UDF s názvem first_udf, které vybere první prvek vektorového sloupce. Pro všechny položky, které nejsou vektorem obsahujícím alespoň jeden prvek, nastav výchozí hodnotu 0.0 a výstup přetypuj na float.
  • Pomocí operace select na df aplikuj first_udf na sloupec output.