ComeçarComece de graça

Reordenando linhas

Nos tempos em que a música era armazenada em CDs, havia um problema recorrente: como organizar seus CDs para encontrar o que você quer? Por artista? Cronologicamente? Por gênero?

A função arrange() permite reordenar as linhas de um tibble. Ela recebe um tibble, seguido pelos nomes não citados das colunas. Por exemplo, para ordenar em ordem crescente pelos valores da coluna x e, em caso de empate em x, em ordem decrescente pelos valores de y, você escreveria o seguinte:

a_tibble %>%
  arrange(x, desc(y))

Repare no uso de desc() para forçar a ordenação em ordem decrescente. Também vale lembrar que, no sparklyr, a função order(), usada para ordenar as linhas de data.frames, não funciona.

Este exercício faz parte do curso

Introdução ao Spark com sparklyr em R

Ver curso

Instruções do exercício

Uma conexão com o Spark já foi criada para você como spark_conn. Um tibble ligado aos metadados de faixas armazenados no Spark foi pré-definido como track_metadata_tbl.

  • Selecione os campos artist_name, release, title e year.
  • Faça pipe do resultado para filtrar faixas da década de 1960.
  • Faça pipe do resultado para arrange() para ordenar por artist_name, depois year em ordem decrescente, e depois title.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

# Manipulate the track metadata
track_metadata_tbl %>%
  # Select columns
  ___ %>%
  # Filter rows
  ___ %>%
  # Arrange rows
  ___
Editar e executar o código