Interval kepercayaan t dengan bootstrap
Latihan sebelumnya memberi Anda dua hal:
- Anda dapat mengukur keragaman yang terkait dengan \(\hat{p}\) dengan melakukan resampling dari sampel asli.
- Setelah Anda mengetahui keragaman \(\hat{p}\), Anda dapat menggunakannya untuk mengukur seberapa jauh proporsi sebenarnya.
Perhatikan bahwa tingkat kedekatan (di sini 95%) mengacu pada seberapa sering suatu sampel terpilih sehingga dekat dengan parameter populasi. Anda tidak akan pernah tahu apakah suatu himpunan data tertentu dekat atau jauh dari parameter, tetapi Anda tahu bahwa sepanjang waktu, 95% sampel yang Anda kumpulkan seharusnya menghasilkan taksiran yang berada dalam \(2SE\) dari parameter populasi sebenarnya.
Suara dari satu jajak pendapat, one_poll, dan data dari 1000 resampling bootstrap, one_poll_boot, tersedia di ruang kerja Anda. Keduanya didasarkan pada Eksperimen 2 dari awal bab ini.
Seperti pada latihan sebelumnya, saat membahas keragaman suatu statistik, angka tersebut disebut sebagai standard error.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Petunjuk latihan
- Hitung \(\hat{p}\) dan simpan hasilnya ke
p_hat. Dalam pemanggilansummarize(), hitungstatsebagai rata-rata darivoteyang bernilai"yes". - Temukan suatu interval nilai yang masuk akal untuk parameter sebenarnya dengan menghitung \(\hat{p} \pm 2SE\).
- Batas
lowerdari interval kepercayaan adalahp_hatdikurangi dua kali standard error daristat. Gunakansd()untuk menghitung standard error. - Batas
upperadalahp_hatditambah dua kali standard error daristat.
- Batas
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# From previous exercises
one_poll <- all_polls %>%
filter(poll == 1) %>%
select(vote)
one_poll_boot <- one_poll %>%
specify(response = vote, success = "yes") %>%
generate(reps = 1000, type = "bootstrap") %>%
calculate(stat = "prop")
p_hat <- one_poll %>%
# Calculate proportion of yes votes
summarize(stat = ___) %>%
pull()
# Create an interval of plausible values
one_poll_boot %>%
summarize(
# Lower bound is p_hat minus 2 std errs
lower = ___,
# Upper bound is p_hat plus 2 std errs
upper = ___
)