Crea un data.frame con una list-column
Concludiamo il capitolo implementando il nostro estrattore di link, ma usando una list-column. L’idea, quando si usa un dataframe annidato (cioè un dataframe con una colonna lista), è di mantenere tutto dentro un dataframe così da avere un workflow ordinato.
Ti è stata fornita una tibble chiamata df, che ha una colonna urls con i quattro URL che hai usato dall’inizio del capitolo. Se vuoi dare un’occhiata a questo dataframe, sentiti libero di stamparlo in console.
Creeremo una nuova colonna chiamata links, che contiene i risultati della funzione get_links() (disponibile nel tuo workspace). Poiché gli output di questa funzione hanno lunghezze diverse, l’output sarà una colonna lista che dovrai poi unnest() per tornare a un dataframe standard.
Questo esercizio fa parte del corso
Programmazione funzionale intermedia con purrr
Istruzioni dell'esercizio
Carica i tre pacchetti necessari:
dplyr,tidyrepurrrPrendi l’oggetto
dfed eseguimutate()su di esso.mutate()applicherà la funzioneget_links()alla colonnaurls.Stampa il risultato.
Esegui l’unnest del risultato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load dplyr, tidyr, and purrr
# Create a "links" columns, by mapping get_links() on urls
df2 <- df %>%
mutate(___ = map(___, get_links))
# Print df2 to see what it looks like
# unnest() df2 to have a tidy dataframe
df2 %>%
___(cols=c(links))