Gruppiertes Bootstrap von Aktienkursen
Du arbeitest als Statistical Analyst für einen Börsenmakler. Du hast die Kursdaten eines Monats mit täglichen Aktienpreisen von der Website der New York Stock Exchange erhalten. Die Daten liegen in folgendem Format vor:
Company Price
1 Google 2863.00
2 Microsoft 335.46
3 Netflix 591.61
4 Facebook 346.91
...
Dein Chef möchte die Verteilung für jedes Unternehmen in einer eigenen Spalte sehen, damit er sie in Microsoft Excel leicht plotten kann.
Die Daten sind bereits in deinem Workspace als df_stocks geladen. Du hast außerdem eine Funktion mean_dist() geschrieben, um das Bootstrapping durchzuführen. mean_dist() akzeptiert einen Data Frame eines einzelnen Unternehmens und gibt einen Vektor aus. Du sollst diese Berechnung parallel ausführen. Das Paket furrr wurde für dich geladen.
Diese Übung ist Teil des Kurses
Paralleles Programmieren in R
Anleitung zur Übung
- Plane eine Multisession mit vier Workern.
- Teile den Data Frame nach eindeutigen Werten in der Spalte
Companyauf. - Wende
mean_dist()auf die geteilten Data Frames an, und zwar mit derfuture_map()-Variante, die Ergebnisse als Spalten eines Data Frames kombiniert. - Kehre zu einem sequenziellen Plan zurück.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plan a multisession of four workers
___(___, ___)
df_stocks %>%
# Split the data by Company
___(___) %>%
# Apply mean_dist() using the correct future_map() variant
___(___)
# Revert to sequential plan
___(___)