Concaténer par lignes les résultats de future_map
Vous travaillez pour un cabinet de conseil en études supérieures qui recommande des universités américaines à des candidats à l’étranger. Vous avez obtenu un jeu de données de classement des universités contenant une colonne score (recherche, citations, etc.) pour différentes universités.
La statisticienne de l’équipe a rédigé une fonction, calc_quants(), mise à votre disposition. Cette fonction calcule un intervalle pour les scores d’une université donnée. Elle prend deux arguments : 1) un data frame avec la colonne score, et 2) les valeurs de quantiles d’intérêt q_values. Les quantiles d’intérêt sont accessibles via la variable my_q_values.
my_q_values <- c(0.025, 0.975)
On vous demande d’appliquer cette fonction aux données de chaque université en parallèle.
furrr et tidyverse ont été chargés pour vous.
Cet exercice fait partie du cours
Programmation parallèle en R
Instructions
- Créez une configuration qui indique
my_q_valuescomme variable globale requise par tous les workers. - Scindez le data frame
uni_dataparuniversity_name. - Appliquez
calc_quants()aux scores de chaque université en utilisant la variante adéquate defuture_map()pour concaténer les résultats par lignes. - Indiquez les valeurs pour
q_valueset la configuration pour.options.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
plan(cluster, workers = 6)
# Create a configuration object to export global variables
config <- ___(___ = ___)
uni_data %>%
# Split the data frame
___(___) %>%
# Specify the future_map variant and the function to map
___(___,
# Specify values for the q_values argument and configuration for .options
q_values = ___,
.options = ___,
.id = "university")
plan(sequential)