CommencerCommencer gratuitement

Mother's little helper (2)

Une façon plus générale de faire correspondre des colonnes consiste à vérifier si leurs noms contiennent une valeur n’importe où (plutôt que de commencer ou de se terminer par une valeur). Comme vous pouvez vous en douter, vous pouvez le faire avec l’assistant contains().

Plus généralement encore, vous pouvez faire correspondre des colonnes à l’aide d’expressions régulières. Les expressions régulières (ou « regex ») sont un langage puissant pour repérer des motifs dans du texte. Si vous souhaitez apprendre à les utiliser, suivez le cours *String Manipulation with stringr in R *. Pour l’instant, vous n’avez besoin de connaître que trois choses.

  1. a : une lettre signifie « faire correspondre cette lettre ».
  2. . : un point signifie « faire correspondre n’importe quel caractère, y compris lettres, chiffres, ponctuation, etc. ».
  3. ? : un point d’interrogation signifie « le caractère précédent est facultatif ».

Vous pouvez trouver les colonnes qui correspondent à une regex donnée avec l’assistant matches() dans select().

Cet exercice fait partie du cours

Introduction à Spark avec sparklyr en R

Afficher le cours

Instructions

Une connexion Spark a été créée pour vous sous le nom spark_conn. Un tibble lié aux métadonnées des pistes stockées dans Spark a été pré‑défini sous le nom track_metadata_tbl.

  • Sélectionnez toutes les colonnes de track_metadata_tbl qui contiennent "ti".
  • Sélectionnez toutes les colonnes de track_metadata_tbl qui correspondent à l’expression régulière "ti.?t".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

track_metadata_tbl %>%
  # Select columns containing ti
  ___

track_metadata_tbl %>%
  # Select columns matching ti.?t
  ___
Modifier et exécuter le code