Fai combaciare tutti i gruppi di cattura
In questo esercizio lavorerai con un file di testo chiamato top_10 che contiene i titoli dei film e la loro posizione in classifica. In questo testo su più righe, \\n viene usato per andare a capo. Userai la funzione str_split() per dividere il file di testo in più righe.
La nuova matrice a una riga top_10_lines conterrà quindi dieci righe con lo stesso schema: la posizione del film, seguita da un punto e uno spazio, e poi il titolo del film. La funzione str_match() e due gruppi di cattura () ti permetteranno di estrarre queste due informazioni dal testo grezzo in una forma tabellare.
Questo esercizio fa parte del corso
Espressioni regolari intermedie in R
Istruzioni dell'esercizio
- Usa la funzione
str_split()per dividere il testo nelle sue righe, ottenendo una matrice di caratteri abilitandosimplify. - Familiarizzati con la struttura di una riga. Contiene la posizione e il titolo di un film.
- Estrai la posizione e il titolo di un film usando i gruppi di cattura nella funzione
str_match().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Split the input by line break and enable simplify
top_10_lines <- str_split(
top_10,
pattern = "___",
simplify = ___
)
# Inspect the first three lines and analyze their form
___[1:3]
# Add to the pattern two capturing groups that match rank and title
str_match(
top_10_lines,
pattern = "___\\. ___"
)