Samenvatten van genderverschillen
Als eerste stap in elke analyse moet je naar de data kijken en deze samenvatten. Categorische variabelen worden vaak samengevat met proporties, en het is altijd belangrijk om de noemer van de proportie te begrijpen.
Wil je de proportie vrouwen die zijn gepromoveerd, of de proportie gepromoveerden die vrouw waren? Hier wil je het eerste, dus in je R-code is het nodig om te group_by() op de variabele sex.
De gegevens van het discriminatieonderzoek zijn beschikbaar in je werkruimte als disc.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
- Gebruik de functie
count()uitdplyrom de variabelensexenpromotete turven. - Vat de data samen door
group_by()te gebruiken op de variabelesex. - Bepaal de proportie die is gepromoveerd. Noem deze variabele
promoted_prop. Let op: bij binaire variabelen kun je de proportie van een van de waarden vinden met de functiemean()(bijv.mean(variable == "value")).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a contingency table summarizing the data
disc %>%
# Count the rows by sex, promote
___
# Find proportion of each sex who were promoted
disc %>%
# Group by sex
___
# Calculate proportion promoted summary stat
___