Uitsplitsen per provincie
Hoewel de totale aantallen stemmen het belangrijkst zijn, kun je met de geografische informatie dieper in deze data duiken. In deze oefening zie je hoe de resultaten per provincie verschilden.
Won Ahmadinejad in het hele land, of waren er provincies waar de nummer twee de meeste stemmen haalde? Om dit te onderzoeken, begin je met het maken van een gegevensset op provincieniveau.
Deze oefening maakt deel uit van de cursus
Inferentie voor categorische gegevens in R
Oefeninstructies
- Begin met
iran, groepeer per provincie en vat vervolgens samen met twee variabelen: de som van de stemmen van de nummer één en de som van de stemmen van de nummer twee. Geef elke nieuwe kolom de naam van de kandidaat. - Inspecteer
province_totals. - Filter
province_totalsop elke rij waar de nummer twee meer stemmen kreeg dan de nummer één.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Construct province-level dataset
province_totals <- ___ %>%
# Group by province
___ %>%
# Sum up votes for top two candidates
___
# Inspect data frame
province_totals
# Filter for won provinces won by #2
___ %>%
___(___ > ___)