1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Použití UDF na vektorová data

K dispozici máš dataframe df se sloupcem output typu vector. Jeho prvních pět řádků vidíš v konzoli.

K dispozici je také UDF get_first_udf, která vybere první prvek vektorového sloupce.

Pokyny

100 XP
  • Vytvoř nový dataframe df_new tak, že do df přidáš nový sloupec. Nový sloupec pojmenuj label.
  • Zobraz prvních pět řádků dataframu df_new.