Aan de slagGa gratis aan de slag

Samenvatten van genderverschillen

Als eerste stap in elke analyse moet je naar de data kijken en deze samenvatten. Categorische variabelen worden vaak samengevat met proporties, en het is altijd belangrijk om de noemer van de proportie te begrijpen.

Wil je de proportie vrouwen die zijn gepromoveerd, of de proportie gepromoveerden die vrouw waren? Hier wil je het eerste, dus in je R-code is het nodig om te group_by() op de variabele sex.

De gegevens van het discriminatieonderzoek zijn beschikbaar in je werkruimte als disc.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Oefeninstructies

  • Gebruik de functie count() uit dplyr om de variabelen sex en promote te turven.
  • Vat de data samen door group_by() te gebruiken op de variabele sex.
  • Bepaal de proportie die is gepromoveerd. Noem deze variabele promoted_prop. Let op: bij binaire variabelen kun je de proportie van een van de waarden vinden met de functie mean() (bijv. mean(variable == "value")).

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a contingency table summarizing the data
disc %>%
  # Count the rows by sex, promote
  ___

# Find proportion of each sex who were promoted
disc %>%
  # Group by sex
  ___
  # Calculate proportion promoted summary stat
  ___
Code bewerken en uitvoeren