1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Porządkowanie wierszy

W czasach, gdy muzyka była trzymana na płytach CD, powracał ten sam problem: jak najlepiej ułożyć płyty, żeby szybko znaleźć to, czego szukasz? Według wykonawcy? Chronologicznie? Według gatunku?

Funkcja arrange() pozwala zmieniać kolejność wierszy w tibble. Przyjmuje tibble, a po nim – niecytowane nazwy kolumn. Na przykład, aby posortować rosnąco według wartości kolumny x, a przy remisie – malejąco według wartości y, napisz:

a_tibble %>%
  arrange(x, desc(y))

Zwróć uwagę na użycie desc() do wymuszenia sortowania malejącego. Pamiętaj też, że w sparklyr funkcja order(), stosowana do porządkowania wierszy w data.frameach, nie jest obsługiwana.

Instrukcje

100 XP

Połączenie ze Sparkiem zostało już utworzone jako spark_conn. Tibble powiązany z metadanymi ścieżek przechowywanymi w Sparku jest wstępnie zdefiniowany jako track_metadata_tbl.

  • Wybierz pola artist_name, release, title i year.
  • Przekaż wynik przez potok do filtrowania ścieżek z lat 60.
  • Przekaż wynik przez potok do arrange(), aby posortować według artist_name, następnie malejąco według year, a potem według title.