Zusammenfassung: Geschlechterdiskriminierung
Am Anfang jeder Analyse solltest du dir die Daten anschauen und sie zusammenfassen. Kategoriale Variablen werden oft mit Anteilen beschrieben, und es ist immer wichtig, den Nenner dieses Anteils zu verstehen.
Willst du den Anteil der Frauen, die befördert wurden, oder den Anteil der beförderten Personen, die Frauen waren? Hier brauchst du Ersteres, daher musst du in deinem R-Code nach der Variablen sex group_by() anwenden.
Die Daten der Diskriminierungsstudie stehen dir in deinem Workspace als disc zur Verfügung.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Verwende die Funktion
count()ausdplyr, um die Variablensexundpromotezu zählen. - Fasse die Daten zusammen, indem du
group_by()auf die Variablesexanwendest. - Ermittle den Anteil der Beförderten. Nenne diese Variable
promoted_prop. Beachte: Bei binären Variablen lässt sich der Anteil eines Werts mit der Funktionmean()bestimmen (z. B.mean(variable == "value")).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a contingency table summarizing the data
disc %>%
# Count the rows by sex, promote
___
# Find proportion of each sex who were promoted
disc %>%
# Group by sex
___
# Calculate proportion promoted summary stat
___