Mother's little helper (2)
Une façon plus générale de faire correspondre des colonnes consiste à vérifier si leurs noms contiennent une valeur n’importe où (plutôt que de commencer ou de se terminer par une valeur). Comme vous pouvez vous en douter, vous pouvez le faire avec l’assistant contains().
Plus généralement encore, vous pouvez faire correspondre des colonnes à l’aide d’expressions régulières. Les expressions régulières (ou « regex ») sont un langage puissant pour repérer des motifs dans du texte. Si vous souhaitez apprendre à les utiliser, suivez le cours *String Manipulation with stringr in R *. Pour l’instant, vous n’avez besoin de connaître que trois choses.
a: une lettre signifie « faire correspondre cette lettre »..: un point signifie « faire correspondre n’importe quel caractère, y compris lettres, chiffres, ponctuation, etc. ».?: un point d’interrogation signifie « le caractère précédent est facultatif ».
Vous pouvez trouver les colonnes qui correspondent à une regex donnée avec l’assistant matches() dans select().
Cet exercice fait partie du cours
Introduction à Spark avec sparklyr en R
Instructions
Une connexion Spark a été créée pour vous sous le nom spark_conn. Un tibble lié aux métadonnées des pistes stockées dans Spark a été pré‑défini sous le nom track_metadata_tbl.
- Sélectionnez toutes les colonnes de
track_metadata_tblqui contiennent"ti". - Sélectionnez toutes les colonnes de
track_metadata_tblqui correspondent à l’expression régulière"ti.?t".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns containing ti
___
track_metadata_tbl %>%
# Select columns matching ti.?t
___