IniziaInizia gratis

Crea un data.frame con una list-column

Concludiamo il capitolo implementando il nostro estrattore di link, ma usando una list-column. L’idea, quando si usa un dataframe annidato (cioè un dataframe con una colonna lista), è di mantenere tutto dentro un dataframe così da avere un workflow ordinato.

Ti è stata fornita una tibble chiamata df, che ha una colonna urls con i quattro URL che hai usato dall’inizio del capitolo. Se vuoi dare un’occhiata a questo dataframe, sentiti libero di stamparlo in console.

Creeremo una nuova colonna chiamata links, che contiene i risultati della funzione get_links() (disponibile nel tuo workspace). Poiché gli output di questa funzione hanno lunghezze diverse, l’output sarà una colonna lista che dovrai poi unnest() per tornare a un dataframe standard.

Questo esercizio fa parte del corso

Programmazione funzionale intermedia con purrr

Visualizza il corso

Istruzioni dell'esercizio

  • Carica i tre pacchetti necessari: dplyr, tidyr e purrr

  • Prendi l’oggetto df ed esegui mutate() su di esso. mutate() applicherà la funzione get_links() alla colonna urls.

  • Stampa il risultato.

  • Esegui l’unnest del risultato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load dplyr, tidyr, and purrr




# Create a "links" columns, by mapping get_links() on urls
df2 <- df %>%
  mutate(___ = map(___, get_links)) 

# Print df2 to see what it looks like


# unnest() df2 to have a tidy dataframe
df2 %>%
  ___(cols=c(links))
Modifica ed esegui il codice