LoslegenKostenlos loslegen

Gruppiertes Bootstrap von Aktienkursen

Du arbeitest als Statistical Analyst für einen Börsenmakler. Du hast die Kursdaten eines Monats mit täglichen Aktienpreisen von der Website der New York Stock Exchange erhalten. Die Daten liegen in folgendem Format vor:

    Company   Price
1    Google 2863.00
2 Microsoft  335.46
3   Netflix  591.61
4  Facebook  346.91
...

Dein Chef möchte die Verteilung für jedes Unternehmen in einer eigenen Spalte sehen, damit er sie in Microsoft Excel leicht plotten kann.

Die Daten sind bereits in deinem Workspace als df_stocks geladen. Du hast außerdem eine Funktion mean_dist() geschrieben, um das Bootstrapping durchzuführen. mean_dist() akzeptiert einen Data Frame eines einzelnen Unternehmens und gibt einen Vektor aus. Du sollst diese Berechnung parallel ausführen. Das Paket furrr wurde für dich geladen.

Diese Übung ist Teil des Kurses

Paralleles Programmieren in R

Kurs anzeigen

Anleitung zur Übung

  • Plane eine Multisession mit vier Workern.
  • Teile den Data Frame nach eindeutigen Werten in der Spalte Company auf.
  • Wende mean_dist() auf die geteilten Data Frames an, und zwar mit der future_map()-Variante, die Ergebnisse als Spalten eines Data Frames kombiniert.
  • Kehre zu einem sequenziellen Plan zurück.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Plan a multisession of four workers
___(___, ___)

df_stocks %>% 
# Split the data by Company
  ___(___) %>% 
# Apply mean_dist() using the correct future_map() variant
  ___(___)

# Revert to sequential plan
___(___)
Code bearbeiten und ausführen