Aan de slagBegin gratis

Bootstrap in stukken opdelen

Je onderzoekt hoe universiteiten wereldwijd samenwerken aan onderzoek en ontwikkeling. In je werkruimte staat een lijst met 100 dataframes, ls_edu. Elk dataframe bevat samenwerkingsscores voor universiteiten in een bepaald land.

Je hebt ook de functie rating_quants() die voor één dataframe de kwantielen van de samenwerkingsscore berekent.

Je hebt vijf cores beschikbaar voor deze berekening. Je probeerde rating_quants() toe te passen op ls_edu met future_map_dfr(), maar de computer kreeg een tekort aan RAM en je R-sessie crashte. Je besluit nu een chunkgrootte van 35 te gebruiken zodat er nooit meer dan drie bootstraps tegelijk draaien. Het furrr-pakket is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Parallel programmeren in R

Bekijk cursus

Oefeninstructies

  • Plan een multisession met vijf workers.
  • Maak een configuratie voor future_map_dfr()-functies en geef een chunkgrootte van 35 op.
  • Geef deze configuratie door aan het juiste argument van future_map_dfr().
  • Ga terug naar een sequentieel plan.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Plan a multisession of five workers
___

# Make a configuration specifying chunk size
config <- ___
future_map_dfr(ls_edu, rating_quants,
# Supply the configuration to the correct argument
               ___ = ___,
               .id = "country")

# Revert to sequential plan
___
Code bewerken en uitvoeren