Bootstrap in stukken opdelen
Je onderzoekt hoe universiteiten wereldwijd samenwerken aan onderzoek en ontwikkeling. In je werkruimte staat een lijst met 100 dataframes, ls_edu. Elk dataframe bevat samenwerkingsscores voor universiteiten in een bepaald land.
Je hebt ook de functie rating_quants() die voor één dataframe de kwantielen van de samenwerkingsscore berekent.
Je hebt vijf cores beschikbaar voor deze berekening. Je probeerde rating_quants() toe te passen op ls_edu met future_map_dfr(), maar de computer kreeg een tekort aan RAM en je R-sessie crashte. Je besluit nu een chunkgrootte van 35 te gebruiken zodat er nooit meer dan drie bootstraps tegelijk draaien. Het furrr-pakket is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Parallel programmeren in R
Oefeninstructies
- Plan een multisession met vijf workers.
- Maak een configuratie voor
future_map_dfr()-functies en geef een chunkgrootte van35op. - Geef deze configuratie door aan het juiste argument van
future_map_dfr(). - Ga terug naar een sequentieel plan.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plan a multisession of five workers
___
# Make a configuration specifying chunk size
config <- ___
future_map_dfr(ls_edu, rating_quants,
# Supply the configuration to the correct argument
___ = ___,
.id = "country")
# Revert to sequential plan
___