1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Pomocne narzędzia (1)

Jeśli twój zbiór danych ma tysiące kolumn i chcesz wybrać wiele z nich, ręczne wpisywanie nazwy każdej kolumny w wywołaniu select() może być bardzo żmudne. Na szczęście select() oferuje zestaw funkcji pomocniczych, które ułatwiają wybieranie wielu kolumn bez konieczności pisania długiego kodu.

Wśród tych funkcji są starts_with() i ends_with(), które dopasowują kolumny zaczynające się lub kończące się określonym prefiksem bądź sufiksem. Ze względu na specjalny sposób interpretowania kodu przez dplyr, funkcje te można wywoływać tylko wewnątrz select() – poza tym kontekstem nie mają zastosowania.

Instrukcje

100 XP

Połączenie ze Sparkiem zostało już utworzone jako spark_conn. Tibble powiązany z metadanymi utworów przechowywanymi w Sparku jest wstępnie zdefiniowany jako track_metadata_tbl.

  • Wybierz wszystkie kolumny z track_metadata_tbl zaczynające się od "artist".
  • Wybierz wszystkie kolumny z track_metadata_tbl kończące się na "id".