Aan de slagGa gratis aan de slag

Uitsplitsen per provincie

Hoewel de totale aantallen stemmen het belangrijkst zijn, kun je met de geografische informatie dieper in deze data duiken. In deze oefening zie je hoe de resultaten per provincie verschilden.

Won Ahmadinejad in het hele land, of waren er provincies waar de nummer twee de meeste stemmen haalde? Om dit te onderzoeken, begin je met het maken van een gegevensset op provincieniveau.

Deze oefening maakt deel uit van de cursus

Inferentie voor categorische gegevens in R

Cursus bekijken

Oefeninstructies

  • Begin met iran, groepeer per provincie en vat vervolgens samen met twee variabelen: de som van de stemmen van de nummer één en de som van de stemmen van de nummer twee. Geef elke nieuwe kolom de naam van de kandidaat.
  • Inspecteer province_totals.
  • Filter province_totals op elke rij waar de nummer twee meer stemmen kreeg dan de nummer één.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Construct province-level dataset
province_totals <- ___ %>%
  # Group by province
  ___ %>%
  # Sum up votes for top two candidates
  ___ 

   
# Inspect data frame
province_totals

# Filter for won provinces won by #2
___ %>%
  ___(___ > ___)
Code bewerken en uitvoeren