Stichprobengröße in der Randomisierungsverteilung
Wir haben zwei neue Datensätze für dich erstellt, die im Wesentlichen denselben Unterschied in den Anteilen wie die ursprünglichen Diskriminierungsdaten aufweisen. Allerdings ist einer der Datensätze (disc_small) nur ein Drittel so groß wie der ursprüngliche Datensatz, und der andere (disc_big) ist zehnmal größer als der ursprüngliche Datensatz.
Außerdem wurde derselbe zuvor verwendete Permutationscode auf die kleinen und großen Datensätze angewendet, um kleine und große Verteilungen permutierter Unterschiede in Beförderungsraten zu erzeugen (disc_small_perm bzw. disc_big_perm).
In dieser Übung nutzt du diese beiden neuen Verteilungen, um ein Gefühl dafür zu bekommen, wie sich die Unterschiede bei sehr unterschiedlichen Stichprobengrößen verändern. Achte insbesondere auf die Spannweite der Variabilität auf der x-Achse in jedem Plot.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Tabulate the small dataset
disc_small %>%
# Select sex and promote
___(___, ___)
# Do the same for disc_big
___