Dampak ukuran sampel pada CI bootstrap
Pada latihan pilihan ganda sebelumnya, Anda mengetahui bahwa jika Anda melakukan resampling data dengan ukuran yang salah (misalnya 300 atau 3, bukan 30), galat baku (SE) dari proporsi sampel menjadi tidak tepat. Dengan 300 observasi hasil resampling, SE terlalu kecil. Dengan 3 observasi hasil resampling, SE terlalu besar.
Di sini, Anda akan menggunakan galat baku yang salah (berdasarkan ukuran sampel yang salah) untuk membuat sebuah selang kepercayaan. Idenya adalah ketika galat baku keliru, selangnya tidak terlalu bermanfaat dan juga tidak benar.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Petunjuk latihan
- Sebuah fungsi untuk menghitung selang kepercayaan t hasil bootstrap,
calc_t_conf_int(), ditampilkan dalam skrip. Bacalah kodenya dan usahakan untuk memahaminya. - Panggil
calc_t_conf_int()padaone_poll_bootuntuk menghitung selang kepercayaan t yang benar. - Lakukan hal yang sama pada
one_poll_boot_300, untuk menemukan selang yang salah bagi resampling berukuran 300. - Lakukan hal yang sama pada
one_poll_boot_3, untuk menemukan selang yang salah bagi resampling berukuran 3.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
calc_t_conf_int <- function(resampled_dataset) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)
# ... and for 300 resamples
___
# ... and for 3 resamples
___