CommencerCommencer gratuitement

foreach avec variables et packages

Le taux auquel une population augmente est appelé taux de croissance, exprimé en pourcentage. Presque tous les pays connaissent une baisse de leur taux de croissance, mais certains diminuent plus vite que d’autres.

Vous avez été recruté en tant qu’analyste démographique, et votre mission est de calculer le ratio entre le taux de croissance de la population d’un pays et le taux de croissance mondial pour les années 2017 à 2021. On vous a fourni une liste de data frames, ls_df, chacun étant un data frame de ce type :

    country year growth_rate
Afghanistan 2017        2.52
...

Vous disposez également d’un data frame de croissance mondiale, df_global :

year global_growth
2017          1.15
...

foreach et dplyr ont été chargés pour vous. Le cluster a déjà été créé et enregistré auprès du backend de foreach.

Cet exercice fait partie du cours

Programmation parallèle en R

Afficher le cours

Instructions

  • Exportez df_global vers le cluster dans l’appel à la fonction foreach().
  • Indiquez le package dplyr requis pour le calcul.
  • Spécifiez rbind comme méthode de combinaison.
  • Utilisez l’opérateur parallèle.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

df_comp <- foreach(df = ls_df,
                   # Export variable
                   ___,
                   # Specify any package needed
                   ___,
                   # Specify a combine method 
                   ___
                   # Use the parallel operator
                  ) ___ {
    df %>%
      left_join(df_global, "year") %>% 
      mutate(comp = growth_rate/global_growth)
}

stopCluster(cl)
Modifier et exécuter le code