Mengacak diskriminasi gender
Ingat bahwa kita sedang mempertimbangkan situasi di mana jumlah pria dan wanita tetap (mewakili resume) dan jumlah orang yang dipromosikan juga tetap (para manajer hanya dapat mempromosikan 35 orang).
Dalam latihan ini, Anda akan membuat distribusi pengacakan dari statistik nol dengan 1000 replikasi, bukan hanya 5 seperti pada latihan sebelumnya. Sebagai pengingat, statistik yang diperhatikan adalah selisih proporsi yang dipromosikan antar gender (yaitu proporsi untuk laki-laki dikurangi proporsi untuk perempuan). Dari himpunan data asli, Anda dapat menghitung perbedaan tingkat promosi antara laki-laki dan perempuan. Menggunakan alur kerja tentukan-hipotesis-hasilkan-hitung di infer, Anda dapat menghitung statistik yang sama, tetapi alih-alih mendapatkan satu angka, Anda memperoleh seluruh distribusi. Dalam latihan ini, Anda akan membandingkan angka tunggal dari himpunan data asli dengan distribusi yang dihasilkan oleh simulasi.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
# Group by sex
group_by(___) %>%
# Summarize to calculate fraction promoted
___(prop_prom = ___(___)) %>%
# Summarize to calculate difference
___(stat = ___(___)) %>%
pull()
# See the result
diff_orig