Maak een data.frame met een lijst-kolom
We sluiten dit hoofdstuk af met een implementatie van onze link-extractor, maar dan met een lijst-kolom. Het idee bij een genestte dataframe (dus: een dataframe met een lijst-kolom) is om alles binnen één dataframe te houden, zodat je workflow netjes en overzichtelijk blijft.
Je hebt een tibble df gekregen met een kolom urls met de vier URL’s die je sinds het begin van dit hoofdstuk gebruikt. Wil je deze dataframe bekijken? Print hem dan gerust in de console.
We gaan een nieuwe kolom links maken met de resultaten van de functie get_links() (beschikbaar in je werkruimte). Omdat de uitvoer van deze functie verschillende lengtes heeft, wordt de output een lijst-kolom die je daarna moet unnest() om weer een standaard dataframe te krijgen.
Deze oefening maakt deel uit van de cursus
Gevorderd functioneel programmeren met purrr
Oefeninstructies
Laad de drie benodigde packages:
dplyr,tidyrenpurrrNeem het object
dfen voermutate()erop uit.mutate()zal de functieget_links()mappen over de kolomurls.Print het resultaat.
Unnest het resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load dplyr, tidyr, and purrr
# Create a "links" columns, by mapping get_links() on urls
df2 <- df %>%
mutate(___ = map(___, get_links))
# Print df2 to see what it looks like
# unnest() df2 to have a tidy dataframe
df2 %>%
___(cols=c(links))