Randomizzazione della discriminazione di genere

Ricorda che stiamo considerando una situazione in cui il numero di uomini e donne è fisso (rappresenta i CV) e il numero di persone promosse è fisso (i manager potevano promuovere solo 35 persone).

In questo esercizio creerai una distribuzione di randomizzazione della statistica nulla con 1000 repliche, invece di sole 5 come nell’esercizio precedente. Come promemoria, la statistica di interesse è la differenza tra le proporzioni di promossi nei due generi (cioè proporzione per i maschi meno proporzione per le femmine). Dal dataset originale puoi calcolare come differiscono i tassi di promozione tra maschi e femmine. Usando il flusso di lavoro specify-hypothesis-generate-calculate in infer, puoi calcolare la stessa statistica, ma invece di ottenere un singolo numero, ottieni un’intera distribuzione. In questo esercizio confronterai quel singolo numero del dataset originale con la distribuzione prodotta dalla simulazione.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
  # Group by sex
  group_by(___) %>%
  # Summarize to calculate fraction promoted
  ___(prop_prom = ___(___)) %>%
  # Summarize to calculate difference
  ___(stat = ___(___)) %>% 
  pull()
    
# See the result
diff_orig

Modifica ed esegui il codice