IniziaInizia gratis

Fai combaciare tutti i gruppi di cattura

In questo esercizio lavorerai con un file di testo chiamato top_10 che contiene i titoli dei film e la loro posizione in classifica. In questo testo su più righe, \\n viene usato per andare a capo. Userai la funzione str_split() per dividere il file di testo in più righe.

La nuova matrice a una riga top_10_lines conterrà quindi dieci righe con lo stesso schema: la posizione del film, seguita da un punto e uno spazio, e poi il titolo del film. La funzione str_match() e due gruppi di cattura () ti permetteranno di estrarre queste due informazioni dal testo grezzo in una forma tabellare.

Questo esercizio fa parte del corso

Espressioni regolari intermedie in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa la funzione str_split() per dividere il testo nelle sue righe, ottenendo una matrice di caratteri abilitando simplify.
  • Familiarizzati con la struttura di una riga. Contiene la posizione e il titolo di un film.
  • Estrai la posizione e il titolo di un film usando i gruppi di cattura nella funzione str_match().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Split the input by line break and enable simplify
top_10_lines <- str_split(
  top_10,
  pattern = "___",
  simplify = ___
)

# Inspect the first three lines and analyze their form
___[1:3]

# Add to the pattern two capturing groups that match rank and title
str_match(
  top_10_lines,
  pattern = "___\\. ___"
)
Modifica ed esegui il codice