Menghitung p-value
Dalam video, Anda mempelajari bahwa p-value mengukur tingkat ketidakselarasan antara data dan hipotesis nol. Di sini, Anda akan menghitung p-value untuk himpunan data diskriminasi asli serta versi kecil dan besar, disc_small dan disc_big.
Perbedaan proporsi asli tersedia di ruang kerja Anda, yaitu diff_orig, diff_orig_small, dan diff_orig_big, demikian pula himpunan data yang telah dipermutasi, disc_perm, disc_perm_small, dan disc_perm_big.
Ingat bahwa Anda hanya tertarik pada uji hipotesis satu arah di sini. Artinya, Anda mencoba menjawab pertanyaan, "Apakah pria lebih mungkin dipromosikan dibandingkan wanita?"
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Petunjuk latihan
- Gunakan
visualize()danget_p_value()dari fungsi bawaaninfer. Ingat bahwa statistik nol berada di bawah selisih asli, sehingga p-value (yang merepresentasikan seberapa sering nilai nol lebih ekstrem) dihitung dengan menghitung banyaknya nilai nol yanggreaterdaripada selisih asli. - Ulangi untuk himpunan data kecil,
disc_perm_small, yang memiliki selisih teramatidiff_orig_small. - Ulangi untuk himpunan data besar,
disc_perm_big, yang memiliki selisih teramatidiff_orig_big. - Anda dapat menguji pemahaman Anda dengan mencoba:
direction = "greater",direction = "two_sided", dandirection = "less"sebelum mengirim jawaban Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)