1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Pomocne narzędzia (2)

Bardziej ogólnym sposobem dopasowywania kolumn jest sprawdzenie, czy ich nazwy zawierają określoną wartość gdziekolwiek w środku (a nie tylko na początku lub końcu). Jak możesz się domyślić, służy do tego pomocnik contains().

Jeszcze bardziej elastycznym rozwiązaniem jest dopasowywanie kolumn za pomocą wyrażeń regularnych. Wyrażenia regularne (w skrócie „regexy") to potężny język służący do dopasowywania tekstu. Jeśli chcesz nauczyć się korzystać z wyrażeń regularnych, zajrzyj do kursu String Manipulation with stringr in R. Na razie wystarczy, że zapamiętasz trzy rzeczy.

  1. a: Litera oznacza „dopasuj tę literę".
  2. .: Kropka oznacza „dopasuj dowolny znak, w tym litery, cyfry, znaki interpunkcyjne itp.".
  3. ?: Znak zapytania oznacza „poprzedni znak jest opcjonalny".

Do wyszukiwania kolumn pasujących do określonego wyrażenia regularnego służy pomocnik matches().

Instrukcje

100 XP

Połączenie ze Sparkiem zostało już utworzone jako spark_conn. Tibble powiązany z metadanymi utworów przechowywanymi w Sparku jest wstępnie zdefiniowany jako track_metadata_tbl.

  • Wybierz wszystkie kolumny z track_metadata_tbl zawierające ciąg "ti".
  • Wybierz wszystkie kolumny z track_metadata_tbl pasujące do wyrażenia regularnego "ti.?t".