Gegroepeerde bootstrap van aandelenkoersen
Je werkt als statistisch analist voor een aandelenmakelaar. Je hebt gegevens ontvangen van één maand aan dagelijkse aandelenkoersen van de website van de New York Stock Exchange. De data heeft het volgende formaat:
Company Price
1 Google 2863.00
2 Microsoft 335.46
3 Netflix 591.61
4 Facebook 346.91
...
Je baas wil de verdeling voor elk bedrijf in een eigen kolom zien zodat hij die eenvoudig kan plotten in Microsoft Excel.
De data staat al in je werkruimte als df_stocks. Je hebt ook een functie geschreven, mean_dist(), om de bootstrapping uit te voeren. mean_dist() accepteert een data frame van één bedrijf en geeft een vector terug. Je moet deze berekening parallel uitvoeren. Het pakket furrr is al voor je geladen.
Deze oefening maakt deel uit van de cursus
Parallel programmeren in R
Oefeninstructies
- Plan een multisession met vier workers.
- Splits het data frame op unieke waarden in de kolom
Company. - Pas
mean_dist()toe op de opgesplitste data frames met defuture_map()-variant die resultaten als kolommen van een data frame samenvoegt. - Ga terug naar een sequentieel plan.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plan a multisession of four workers
___(___, ___)
df_stocks %>%
# Split the data by Company
___(___) %>%
# Apply mean_dist() using the correct future_map() variant
___(___)
# Revert to sequential plan
___(___)