Analyse par province
Même si les totaux nationaux sont les plus importants, vous pouvez approfondir l’analyse en exploitant l’information géographique. Dans cet exercice, vous verrez comment les résultats varient selon les provinces.
Ahmadinejad a-t-il gagné partout dans le pays, ou existe-t-il des provinces où le candidat arrivé deuxième est arrivé en tête ? Pour répondre à cette question, commencez par créer un jeu de données au niveau des provinces.
Cet exercice fait partie du cours
Inférence pour des données catégorielles en R
Instructions
- Partez de
iran, regroupez par province, puis résumez avec deux variables : la somme des voix du candidat arrivé premier et la somme des voix du candidat arrivé deuxième. Donnez à chaque nouvelle colonne le nom du candidat. - Inspectez
province_totals. - Filtrez
province_totalspour conserver chaque ligne où le candidat arrivé deuxième a obtenu plus de voix que le candidat arrivé premier.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Construct province-level dataset
province_totals <- ___ %>%
# Group by province
___ %>%
# Sum up votes for top two candidates
___
# Inspect data frame
province_totals
# Filter for won provinces won by #2
___ %>%
___(___ > ___)