Imbriquer par sujet et par pays
Au chapitre précédent, vous avez construit un modèle linéaire pour chaque pays en imbriquant les données par pays, en ajustant un modèle à chaque sous-ensemble, puis en mettant de l’ordre dans chaque modèle avec broom et en désimbriquant les coefficients. Le code ressemblait à ceci :
country_coefficients <- by_year_country %>%
nest(-country) %>%
mutate(model = map(data, ~ lm(percent_yes ~ year, data = .)),
tidied = map(model, tidy)) %>%
unnest(tidied)
Vous allez maintenant à nouveau modéliser l’évolution du pourcentage de « yes » au fil du temps, mais au lieu d’ajuster un modèle par pays, vous en ajusterez un pour chaque combinaison de pays et de sujet.
Cet exercice fait partie du cours
<cours>Étude de cas : analyse exploratoire de données en R</cours>Instructions de l’exercice
- Chargez les packages
purrr,tidyretbroom. - Affichez le jeu de données
by_country_year_topicdans la console. - Ajustez un modèle linéaire pour chaque pays et chaque sujet dans ce jeu de données, et enregistrez le résultat sous le nom
country_topic_coefficients. Vous pouvez utiliser le code fourni comme point de départ. - Affichez le jeu de données
country_topic_coefficientsdans la console.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Load purrr, tidyr, and broom
# Print by_country_year_topic
# Fit model on the by_country_year_topic dataset
# Print country_topic_coefficients