Aan de slagGa gratis aan de slag

Bootstrap in stukken opdelen

Je onderzoekt hoe universiteiten wereldwijd samenwerken aan onderzoek en ontwikkeling. In je werkruimte staat een lijst met 100 dataframes, ls_edu. Elk dataframe bevat samenwerkingsscores voor universiteiten in een bepaald land.

Je hebt ook de functie rating_quants() die voor één dataframe de kwantielen van de samenwerkingsscore berekent.

Je hebt vijf cores beschikbaar voor deze berekening. Je probeerde rating_quants() toe te passen op ls_edu met future_map_dfr(), maar de computer kreeg een tekort aan RAM en je R-sessie crashte. Je besluit nu een chunkgrootte van 35 te gebruiken zodat er nooit meer dan drie bootstraps tegelijk draaien. Het furrr-pakket is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Parallel programmeren in R

Cursus bekijken

Oefeninstructies

  • Plan een multisession met vijf workers.
  • Maak een configuratie voor future_map_dfr()-functies en geef een chunkgrootte van 35 op.
  • Geef deze configuratie door aan het juiste argument van future_map_dfr().
  • Ga terug naar een sequentieel plan.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plan a multisession of five workers
___

# Make a configuration specifying chunk size
config <- ___
future_map_dfr(ls_edu, rating_quants,
# Supply the configuration to the correct argument
               ___ = ___,
               .id = "country")

# Revert to sequential plan
___
Code bewerken en uitvoeren