Réordonner les lignes
À l’époque où la musique tenait sur des CD, une question revenait sans cesse : comment classer vos CD pour retrouver facilement ce que vous cherchez ? Par ordre d’artiste ? Chronologiquement ? Par genre ?
La fonction arrange() permet de réordonner les lignes d’un tibble. Elle prend un tibble, suivi des noms non quotés des colonnes. Par exemple, pour trier par ordre croissant des valeurs de la colonne x, puis (en cas d’égalité sur x) par ordre décroissant des valeurs de y, vous écririez :
a_tibble %>%
arrange(x, desc(y))
Remarquez l’utilisation de desc() pour imposer un tri décroissant. Notez aussi que dans sparklyr, la fonction [order()](https://www.rdocumentation.org/packages/base/topics/order), utilisée pour ordonner les lignes desdata.frame`, ne fonctionne pas.
Cet exercice fait partie du cours
Introduction à Spark avec sparklyr en R
Instructions
Une connexion Spark a été créée pour vous sous le nom spark_conn. Un tibble associé aux métadonnées des pistes stockées dans Spark a été pré‑défini sous le nom track_metadata_tbl.
- Sélectionnez les champs
artist_name,release,titleetyear. - Faites passer le résultat dans un filtre pour ne garder que les pistes des années 1960.
- Faites ensuite passer le résultat dans
arrange()pour trier parartist_name, puis paryeardécroissant, puis partitle.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
# Manipulate the track metadata
track_metadata_tbl %>%
# Select columns
___ %>%
# Filter rows
___ %>%
# Arrange rows
___