A ajudinha da mamãe (1)
Se o seu conjunto de dados tem milhares de colunas e você quer selecionar várias delas, digitar o nome de cada coluna ao chamar select() pode ser bem trabalhoso. Felizmente, select() tem algumas funções auxiliares que facilitam selecionar várias colunas sem precisar escrever muito código.
Essas auxiliares incluem starts_with() e ends_with(), que correspondem a colunas que começam ou terminam com um determinado prefixo ou sufixo, respectivamente. Devido às técnicas especiais de avaliação de código do dplyr, essas funções só podem ser chamadas dentro de uma chamada a select(); elas não fazem sentido sozinhas.
Este exercício faz parte do curso
Introdução ao Spark com sparklyr em R
Instruções do exercício
Uma conexão Spark foi criada para você como spark_conn. Uma tibble ligada aos metadados das faixas armazenados no Spark foi predefinida como track_metadata_tbl.
- Selecione todas as colunas de
track_metadata_tblque começam com"artist". - Selecione todas as colunas de
track_metadata_tblque terminam com"id".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns starting with artist
___
track_metadata_tbl %>%
# Select columns ending with id
___