CommencerCommencer gratuitement

Concaténer par lignes les résultats de future_map

Vous travaillez pour un cabinet de conseil en études supérieures qui recommande des universités américaines à des candidats à l’étranger. Vous avez obtenu un jeu de données de classement des universités contenant une colonne score (recherche, citations, etc.) pour différentes universités.

La statisticienne de l’équipe a rédigé une fonction, calc_quants(), mise à votre disposition. Cette fonction calcule un intervalle pour les scores d’une université donnée. Elle prend deux arguments : 1) un data frame avec la colonne score, et 2) les valeurs de quantiles d’intérêt q_values. Les quantiles d’intérêt sont accessibles via la variable my_q_values.

my_q_values <- c(0.025, 0.975)

On vous demande d’appliquer cette fonction aux données de chaque université en parallèle.

furrr et tidyverse ont été chargés pour vous.

Cet exercice fait partie du cours

Programmation parallèle en R

Afficher le cours

Instructions

  • Créez une configuration qui indique my_q_values comme variable globale requise par tous les workers.
  • Scindez le data frame uni_data par university_name.
  • Appliquez calc_quants() aux scores de chaque université en utilisant la variante adéquate de future_map() pour concaténer les résultats par lignes.
  • Indiquez les valeurs pour q_values et la configuration pour .options.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

plan(cluster, workers = 6)

# Create a configuration object to export global variables
config <- ___(___ = ___)

uni_data %>%
  # Split the data frame
  ___(___) %>% 
  # Specify the future_map variant and the function to map
  ___(___,
  # Specify values for the q_values argument and configuration for .options
                 q_values = ___,
                 .options = ___,
                 .id = "university")
plan(sequential)
Modifier et exécuter le code