Le petit assistant de maman (1)
Si votre jeu de données comporte des milliers de colonnes et que vous souhaitez en sélectionner beaucoup, taper le nom de chaque colonne dans select() peut devenir fastidieux. Heureusement, select() propose des fonctions d’aide qui facilitent la sélection de plusieurs colonnes sans écrire beaucoup de code.
Ces aides incluent starts_with() et ends_with(), qui correspondent respectivement aux colonnes commençant ou se terminant par un certain préfixe ou suffixe. En raison des techniques particulières d’évaluation de code de dplyr, ces fonctions ne peuvent être appelées qu’à l’intérieur de select() ; elles n’ont pas de sens utilisées seules.
Cet exercice fait partie du cours
Introduction à Spark avec sparklyr en R
Instructions
Une connexion Spark a été créée pour vous sous le nom spark_conn. Une tibble liée aux métadonnées des pistes stockées dans Spark a été pré-définie sous le nom track_metadata_tbl.
- Sélectionnez toutes les colonnes de
track_metadata_tblqui commencent par"artist". - Sélectionnez toutes les colonnes de
track_metadata_tblqui se terminent par"id".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns starting with artist
___
track_metadata_tbl %>%
# Select columns ending with id
___