LoslegenKostenlos loslegen

Zusammenfassung: Geschlechterdiskriminierung

Am Anfang jeder Analyse solltest du dir die Daten anschauen und sie zusammenfassen. Kategoriale Variablen werden oft mit Anteilen beschrieben, und es ist immer wichtig, den Nenner dieses Anteils zu verstehen.

Willst du den Anteil der Frauen, die befördert wurden, oder den Anteil der beförderten Personen, die Frauen waren? Hier brauchst du Ersteres, daher musst du in deinem R-Code nach der Variablen sex group_by() anwenden.

Die Daten der Diskriminierungsstudie stehen dir in deinem Workspace als disc zur Verfügung.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion count() aus dplyr, um die Variablen sex und promote zu zählen.
  • Fasse die Daten zusammen, indem du group_by() auf die Variable sex anwendest.
  • Ermittle den Anteil der Beförderten. Nenne diese Variable promoted_prop. Beachte: Bei binären Variablen lässt sich der Anteil eines Werts mit der Funktion mean() bestimmen (z. B. mean(variable == "value")).

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a contingency table summarizing the data
disc %>%
  # Count the rows by sex, promote
  ___

# Find proportion of each sex who were promoted
disc %>%
  # Group by sex
  ___
  # Calculate proportion promoted summary stat
  ___
Code bearbeiten und ausführen