Bootstrap groupé des cours boursiers
Vous êtes Analyste statisticien chez un courtier. Vous avez reçu un mois de données de cours boursiers quotidiens depuis le site du New York Stock Exchange. Les données sont au format suivant :
Company Price
1 Google 2863.00
2 Microsoft 335.46
3 Netflix 591.61
4 Facebook 346.91
...
Votre responsable souhaite voir la distribution de chaque entreprise dans sa propre colonne afin de pouvoir la tracer facilement dans Microsoft Excel.
Les données sont déjà chargées dans votre espace de travail, df_stocks. Vous avez aussi écrit une fonction, mean_dist(), pour réaliser le bootstrap. mean_dist() prend en entrée un data frame d’une seule entreprise et renvoie un vecteur. Vous devez exécuter ce calcul en parallèle. Le package furrr a été chargé pour vous.
Cet exercice fait partie du cours
Programmation parallèle en R
Instructions
- Planifiez une exécution multisession avec quatre workers.
- Scindez le data frame selon les valeurs uniques de la colonne
Company. - Appliquez
mean_dist()aux data frames scindés en utilisant la variante defuture_map()qui combine les résultats comme des colonnes d’un data frame. - Revenez à un plan séquentiel.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plan a multisession of four workers
___(___, ___)
df_stocks %>%
# Split the data by Company
___(___) %>%
# Apply mean_dist() using the correct future_map() variant
___(___)
# Revert to sequential plan
___(___)