Randomisierung: Geschlechterdiskriminierung

Erinnere dich: Wir betrachten eine Situation, in der die Anzahl von Männern und Frauen fix ist (entspricht den Lebensläufen) und die Anzahl der Beförderten fix ist (die Führungskräfte konnten nur 35 Personen befördern).

In dieser Übung erstellst du eine Randomisierungsverteilung der Null-Statistik mit 1000 Replikationen – im Gegensatz zu nur 5 in der vorherigen Übung. Zur Erinnerung: Die interessante Kennzahl ist der Unterschied der Beförderungsanteile zwischen den Geschlechtern (d. h. Anteil für Männer minus Anteil für Frauen). Aus dem ursprünglichen Datensatz kannst du berechnen, wie sich die Beförderungsraten zwischen Männern und Frauen unterscheiden. Mit dem specify-hypothesis-generate-calculate-Workflow in infer kannst du dieselbe Kennzahl berechnen, erhältst aber statt einer einzelnen Zahl eine ganze Verteilung. In dieser Übung vergleichst du die einzelne Zahl aus dem Originaldatensatz mit der Verteilung aus der Simulation.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
  # Group by sex
  group_by(___) %>%
  # Summarize to calculate fraction promoted
  ___(prop_prom = ___(___)) %>%
  # Summarize to calculate difference
  ___(stat = ___(___)) %>% 
  pull()
    
# See the result
diff_orig

Code bearbeiten und ausführen