Steekproefgrootte in randomisatieverdeling
We hebben twee nieuwe gegevenssets voor je gemaakt met in wezen hetzelfde verschil in proporties als in de oorspronkelijke discriminatiegegevens. Eén van de gegevenssets (disc_small) is echter een derde van de grootte van de oorspronkelijke set en de andere (disc_big) is 10 keer zo groot als de oorspronkelijke set.
Daarnaast is dezelfde permutatiecode als eerder uitgevoerd op de kleine en grote gegevenssets om kleine en grote verdelingen van gepermuteerde verschillen in promotiepercentages te maken (disc_small_perm en disc_big_perm).
In deze oefening gebruik je deze twee nieuwe verdelingen om gevoel te krijgen voor hoe de verschillen variëren bij sterk uiteenlopende steekproefgroottes. Let vooral op het bereik van de variatie op de x-as van elke plot.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Tabulate the small dataset
disc_small %>%
# Select sex and promote
___(___, ___)
# Do the same for disc_big
___