Randomisierung: Geschlechterdiskriminierung
Erinnere dich: Wir betrachten eine Situation, in der die Anzahl von Männern und Frauen fix ist (entspricht den Lebensläufen) und die Anzahl der Beförderten fix ist (die Führungskräfte konnten nur 35 Personen befördern).
In dieser Übung erstellst du eine Randomisierungsverteilung der Null-Statistik mit 1000 Replikationen – im Gegensatz zu nur 5 in der vorherigen Übung. Zur Erinnerung: Die interessante Kennzahl ist der Unterschied der Beförderungsanteile zwischen den Geschlechtern (d. h. Anteil für Männer minus Anteil für Frauen). Aus dem ursprünglichen Datensatz kannst du berechnen, wie sich die Beförderungsraten zwischen Männern und Frauen unterscheiden. Mit dem specify-hypothesis-generate-calculate-Workflow in infer kannst du dieselbe Kennzahl berechnen, erhältst aber statt einer einzelnen Zahl eine ganze Verteilung. In dieser Übung vergleichst du die einzelne Zahl aus dem Originaldatensatz mit der Verteilung aus der Simulation.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
# Group by sex
group_by(___) %>%
# Summarize to calculate fraction promoted
___(prop_prom = ___(___)) %>%
# Summarize to calculate difference
___(stat = ___(___)) %>%
pull()
# See the result
diff_orig