Dimensione del campione nella distribuzione di randomizzazione

Abbiamo creato per te due nuovi insiemi di dati con, in sostanza, la stessa differenza di proporzioni dei dati originali sulla discriminazione. Tuttavia, uno dei dataset (disc_small) è un terzo della dimensione dell'insieme di dati originale e l'altro (disc_big) è 10 volte più grande di quello originale.

Inoltre, lo stesso codice di permutazione usato in precedenza è stato eseguito sui dataset piccolo e grande per creare piccole e grandi distribuzioni delle differenze permutate nei tassi di promozione (disc_small_perm e disc_big_perm, rispettivamente).

In questo esercizio userai queste due nuove distribuzioni per capire come variano le differenze a seconda di dimensioni del campione molto diverse. In particolare, osserva l'ampiezza della variabilità sull'asse x di ciascun grafico.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Tabulate the small dataset
disc_small %>% 
  # Select sex and promote
  ___(___, ___)
  
# Do the same for disc_big
___

Modifica ed esegui il codice