Découper le bootstrap en blocs
Vous étudiez la manière dont les universités collaborent entre elles en matière de recherche et développement. Vous disposez dans votre espace de travail d’une liste de 100 data frames, ls_edu. Chaque data frame contient des scores de collaboration pour les universités d’un pays donné.
Vous avez également la fonction rating_quants() qui calcule des quantiles pour le score de collaboration d’un data frame.
Vous avez cinq cœurs à disposition pour effectuer ce calcul. Vous avez tenté d’appliquer rating_quants() à ls_edu avec future_map_dfr(), mais l’ordinateur a manqué de RAM et votre session R a planté. Vous avez décidé d’utiliser une taille de bloc de 35 afin que pas plus de trois bootstraps ne s’exécutent simultanément. Le package furrr est déjà chargé pour vous.
Cet exercice fait partie du cours
Programmation parallèle en R
Instructions
- Planifiez une exécution multisession avec cinq workers.
- Créez une configuration pour les fonctions
future_map_dfr()et spécifiez une taille de bloc de35. - Fournissez cette configuration à l’argument approprié de
future_map_dfr(). - Revenez à un plan séquentiel.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plan a multisession of five workers
___
# Make a configuration specifying chunk size
config <- ___
future_map_dfr(ls_edu, rating_quants,
# Supply the configuration to the correct argument
___ = ___,
.id = "country")
# Revert to sequential plan
___