Dimensione del campione nella distribuzione di randomizzazione
Abbiamo creato per te due nuovi insiemi di dati con, in sostanza, la stessa differenza di proporzioni dei dati originali sulla discriminazione. Tuttavia, uno dei dataset (disc_small) è un terzo della dimensione dell'insieme di dati originale e l'altro (disc_big) è 10 volte più grande di quello originale.
Inoltre, lo stesso codice di permutazione usato in precedenza è stato eseguito sui dataset piccolo e grande per creare piccole e grandi distribuzioni delle differenze permutate nei tassi di promozione (disc_small_perm e disc_big_perm, rispettivamente).
In questo esercizio userai queste due nuove distribuzioni per capire come variano le differenze a seconda di dimensioni del campione molto diverse. In particolare, osserva l'ampiezza della variabilità sull'asse x di ciascun grafico.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Tabulate the small dataset
disc_small %>%
# Select sex and promote
___(___, ___)
# Do the same for disc_big
___