CommencerCommencer gratuitement

Bootstrap groupé des cours boursiers

Vous êtes Analyste statisticien chez un courtier. Vous avez reçu un mois de données de cours boursiers quotidiens depuis le site du New York Stock Exchange. Les données sont au format suivant :

    Company   Price
1    Google 2863.00
2 Microsoft  335.46
3   Netflix  591.61
4  Facebook  346.91
...

Votre responsable souhaite voir la distribution de chaque entreprise dans sa propre colonne afin de pouvoir la tracer facilement dans Microsoft Excel.

Les données sont déjà chargées dans votre espace de travail, df_stocks. Vous avez aussi écrit une fonction, mean_dist(), pour réaliser le bootstrap. mean_dist() prend en entrée un data frame d’une seule entreprise et renvoie un vecteur. Vous devez exécuter ce calcul en parallèle. Le package furrr a été chargé pour vous.

Cet exercice fait partie du cours

Programmation parallèle en R

Afficher le cours

Instructions

  • Planifiez une exécution multisession avec quatre workers.
  • Scindez le data frame selon les valeurs uniques de la colonne Company.
  • Appliquez mean_dist() aux data frames scindés en utilisant la variante de future_map() qui combine les résultats comme des colonnes d’un data frame.
  • Revenez à un plan séquentiel.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plan a multisession of four workers
___(___, ___)

df_stocks %>% 
# Split the data by Company
  ___(___) %>% 
# Apply mean_dist() using the correct future_map() variant
  ___(___)

# Revert to sequential plan
___(___)
Modifier et exécuter le code