Aleatorizando la discriminación de género

Recuerda que estamos considerando una situación en la que el número de hombres y mujeres está fijado (representa los currículums) y el número de personas ascendidas también está fijado (los gerentes solo podían ascender a 35 personas).

En este ejercicio, crearás una distribución de aleatorización de la estadística nula con 1000 réplicas, en lugar de solo 5 como en el ejercicio anterior. Como recordatorio, la estadística de interés es la diferencia en las proporciones de ascensos entre géneros (es decir, proporción de hombres menos proporción de mujeres). A partir del conjunto de datos original, puedes calcular cómo difieren las tasas de ascenso entre hombres y mujeres. Usando el flujo specify-hypothesis-generate-calculate de infer, puedes calcular la misma estadística, pero en lugar de obtener un único número, obtendrás toda una distribución. En este ejercicio, compararás ese único número del conjunto de datos original con la distribución generada por la simulación.

Este ejercicio forma parte del curso

Fundamentos de la inferencia en R

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
  # Group by sex
  group_by(___) %>%
  # Summarize to calculate fraction promoted
  ___(prop_prom = ___(___)) %>%
  # Summarize to calculate difference
  ___(stat = ___(___)) %>% 
  pull()
    
# See the result
diff_orig

Editar y ejecutar código