1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Rozdělení a rozbalení textového sloupce

K dispozici máš dataframe clauses_df se 100 řádky. Obsahuje sloupec clause a identifikátor řádku. Každý clause je řetězec s jedním nebo více slovy oddělenými mezerami.

Pokyny

100 XP
  • Rozděl sloupec clause do sloupce s názvem words, který bude obsahovat pole jednotlivých slov.
  • Rozbalie sloupec words do sloupce s názvem word.
  • Spočítej výsledný počet řádků.