Aan de slagGa gratis aan de slag

Maak een data.frame met een lijst-kolom

We sluiten dit hoofdstuk af met een implementatie van onze link-extractor, maar dan met een lijst-kolom. Het idee bij een genestte dataframe (dus: een dataframe met een lijst-kolom) is om alles binnen één dataframe te houden, zodat je workflow netjes en overzichtelijk blijft.

Je hebt een tibble df gekregen met een kolom urls met de vier URL’s die je sinds het begin van dit hoofdstuk gebruikt. Wil je deze dataframe bekijken? Print hem dan gerust in de console.

We gaan een nieuwe kolom links maken met de resultaten van de functie get_links() (beschikbaar in je werkruimte). Omdat de uitvoer van deze functie verschillende lengtes heeft, wordt de output een lijst-kolom die je daarna moet unnest() om weer een standaard dataframe te krijgen.

Deze oefening maakt deel uit van de cursus

Gevorderd functioneel programmeren met purrr

Cursus bekijken

Oefeninstructies

  • Laad de drie benodigde packages: dplyr, tidyr en purrr

  • Neem het object df en voer mutate() erop uit. mutate() zal de functie get_links() mappen over de kolom urls.

  • Print het resultaat.

  • Unnest het resultaat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load dplyr, tidyr, and purrr




# Create a "links" columns, by mapping get_links() on urls
df2 <- df %>%
  mutate(___ = map(___, get_links)) 

# Print df2 to see what it looks like


# unnest() df2 to have a tidy dataframe
df2 %>%
  ___(cols=c(links))
Code bewerken en uitvoeren