foreach avec variables et packages
Le taux auquel une population augmente est appelé taux de croissance, exprimé en pourcentage. Presque tous les pays connaissent une baisse de leur taux de croissance, mais certains diminuent plus vite que d’autres.
Vous avez été recruté en tant qu’analyste démographique, et votre mission est de calculer le ratio entre le taux de croissance de la population d’un pays et le taux de croissance mondial pour les années 2017 à 2021. On vous a fourni une liste de data frames, ls_df, chacun étant un data frame de ce type :
country year growth_rate
Afghanistan 2017 2.52
...
Vous disposez également d’un data frame de croissance mondiale, df_global :
year global_growth
2017 1.15
...
foreach et dplyr ont été chargés pour vous. Le cluster a déjà été créé et enregistré auprès du backend de foreach.
Cet exercice fait partie du cours
Programmation parallèle en R
Instructions
- Exportez
df_globalvers le cluster dans l’appel à la fonctionforeach(). - Indiquez le package
dplyrrequis pour le calcul. - Spécifiez
rbindcomme méthode de combinaison. - Utilisez l’opérateur parallèle.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
df_comp <- foreach(df = ls_df,
# Export variable
___,
# Specify any package needed
___,
# Specify a combine method
___
# Use the parallel operator
) ___ {
df %>%
left_join(df_global, "year") %>%
mutate(comp = growth_rate/global_growth)
}
stopCluster(cl)