CommencerCommencer gratuitement

Réordonner les lignes

À l’époque où la musique tenait sur des CD, une question revenait sans cesse : comment classer vos CD pour retrouver facilement ce que vous cherchez ? Par ordre d’artiste ? Chronologiquement ? Par genre ?

La fonction arrange() permet de réordonner les lignes d’un tibble. Elle prend un tibble, suivi des noms non quotés des colonnes. Par exemple, pour trier par ordre croissant des valeurs de la colonne x, puis (en cas d’égalité sur x) par ordre décroissant des valeurs de y, vous écririez :

a_tibble %>%
  arrange(x, desc(y))

Remarquez l’utilisation de desc() pour imposer un tri décroissant. Notez aussi que dans sparklyr, la fonction [order()](https://www.rdocumentation.org/packages/base/topics/order), utilisée pour ordonner les lignes desdata.frame`, ne fonctionne pas.

Cet exercice fait partie du cours

Introduction à Spark avec sparklyr en R

Afficher le cours

Instructions

Une connexion Spark a été créée pour vous sous le nom spark_conn. Un tibble associé aux métadonnées des pistes stockées dans Spark a été pré‑défini sous le nom track_metadata_tbl.

  • Sélectionnez les champs artist_name, release, title et year.
  • Faites passer le résultat dans un filtre pour ne garder que les pistes des années 1960.
  • Faites ensuite passer le résultat dans arrange() pour trier par artist_name, puis par year décroissant, puis par title.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

# Manipulate the track metadata
track_metadata_tbl %>%
  # Select columns
  ___ %>%
  # Filter rows
  ___ %>%
  # Arrange rows
  ___
Modifier et exécuter le code