Gegroepeerde bootstrap van aandelenkoersen

Je werkt als statistisch analist voor een aandelenmakelaar. Je hebt gegevens ontvangen van één maand aan dagelijkse aandelenkoersen van de website van de New York Stock Exchange. De data heeft het volgende formaat:

    Company   Price
1    Google 2863.00
2 Microsoft  335.46
3   Netflix  591.61
4  Facebook  346.91
...

Je baas wil de verdeling voor elk bedrijf in een eigen kolom zien zodat hij die eenvoudig kan plotten in Microsoft Excel.

De data staat al in je werkruimte als df_stocks. Je hebt ook een functie geschreven, mean_dist(), om de bootstrapping uit te voeren. mean_dist() accepteert een data frame van één bedrijf en geeft een vector terug. Je moet deze berekening parallel uitvoeren. Het pakket furrr is al voor je geladen.

Deze oefening maakt deel uit van de cursus

Parallel programmeren in R

Bekijk cursus

Oefeninstructies

Plan een multisession met vier workers.
Splits het data frame op unieke waarden in de kolom Company.
Pas mean_dist() toe op de opgesplitste data frames met de future_map()-variant die resultaten als kolommen van een data frame samenvoegt.
Ga terug naar een sequentieel plan.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Plan a multisession of four workers
___(___, ___)

df_stocks %>% 
# Split the data by Company
  ___(___) %>% 
# Apply mean_dist() using the correct future_map() variant
  ___(___)

# Revert to sequential plan
___(___)

Code bewerken en uitvoeren