CommencerCommencer gratuitement

Le petit assistant de maman (1)

Si votre jeu de données comporte des milliers de colonnes et que vous souhaitez en sélectionner beaucoup, taper le nom de chaque colonne dans select() peut devenir fastidieux. Heureusement, select() propose des fonctions d’aide qui facilitent la sélection de plusieurs colonnes sans écrire beaucoup de code.

Ces aides incluent starts_with() et ends_with(), qui correspondent respectivement aux colonnes commençant ou se terminant par un certain préfixe ou suffixe. En raison des techniques particulières d’évaluation de code de dplyr, ces fonctions ne peuvent être appelées qu’à l’intérieur de select() ; elles n’ont pas de sens utilisées seules.

Cet exercice fait partie du cours

Introduction à Spark avec sparklyr en R

Afficher le cours

Instructions

Une connexion Spark a été créée pour vous sous le nom spark_conn. Une tibble liée aux métadonnées des pistes stockées dans Spark a été pré-définie sous le nom track_metadata_tbl.

  • Sélectionnez toutes les colonnes de track_metadata_tbl qui commencent par "artist".
  • Sélectionnez toutes les colonnes de track_metadata_tbl qui se terminent par "id".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

track_metadata_tbl %>%
  # Select columns starting with artist
  ___

track_metadata_tbl %>%
  # Select columns ending with id
  ___
Modifier et exécuter le code