1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark SQL w Pythonie

Connected

ćwiczenie

Podział i rozwinięcie kolumny tekstowej

Dostępna jest ramka danych clauses_df zawierająca 100 wierszy. Ma ona kolumnę clause oraz identyfikator wiersza. Każda wartość clause to ciąg znaków zawierający jedno lub więcej słów oddzielonych spacjami.

Instrukcje

100 XP
  • Podziel kolumnę clause na kolumnę o nazwie words, zawierającą tablicę pojedynczych słów.
  • Rozwiń kolumnę words do kolumny o nazwie word.
  • Zlicz wynikową liczbę wierszy.