Reordenando linhas
Nos tempos em que a música era armazenada em CDs, havia um problema recorrente: como organizar seus CDs para encontrar o que você quer? Por artista? Cronologicamente? Por gênero?
A função arrange() permite reordenar as linhas de um tibble. Ela recebe um tibble, seguido pelos nomes não citados das colunas. Por exemplo, para ordenar em ordem crescente pelos valores da coluna x e, em caso de empate em x, em ordem decrescente pelos valores de y, você escreveria o seguinte:
a_tibble %>%
arrange(x, desc(y))
Repare no uso de desc() para forçar a ordenação em ordem decrescente. Também vale lembrar que, no sparklyr, a função order(), usada para ordenar as linhas de data.frames, não funciona.
Este exercício faz parte do curso
Introdução ao Spark com sparklyr em R
Instruções do exercício
Uma conexão com o Spark já foi criada para você como spark_conn. Um tibble ligado aos metadados de faixas armazenados no Spark foi pré-definido como track_metadata_tbl.
- Selecione os campos
artist_name,release,titleeyear. - Faça pipe do resultado para filtrar faixas da década de 1960.
- Faça pipe do resultado para
arrange()para ordenar porartist_name, depoisyearem ordem decrescente, e depoistitle.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
# Manipulate the track metadata
track_metadata_tbl %>%
# Select columns
___ %>%
# Filter rows
___ %>%
# Arrange rows
___