MulaiMulai sekarang secara gratis

Interval kepercayaan t dengan bootstrap

Latihan sebelumnya memberi Anda dua hal:

  1. Anda dapat mengukur keragaman yang terkait dengan \(\hat{p}\) dengan melakukan resampling dari sampel asli.
  2. Setelah Anda mengetahui keragaman \(\hat{p}\), Anda dapat menggunakannya untuk mengukur seberapa jauh proporsi sebenarnya.

Perhatikan bahwa tingkat kedekatan (di sini 95%) mengacu pada seberapa sering suatu sampel terpilih sehingga dekat dengan parameter populasi. Anda tidak akan pernah tahu apakah suatu himpunan data tertentu dekat atau jauh dari parameter, tetapi Anda tahu bahwa sepanjang waktu, 95% sampel yang Anda kumpulkan seharusnya menghasilkan taksiran yang berada dalam \(2SE\) dari parameter populasi sebenarnya.

Suara dari satu jajak pendapat, one_poll, dan data dari 1000 resampling bootstrap, one_poll_boot, tersedia di ruang kerja Anda. Keduanya didasarkan pada Eksperimen 2 dari awal bab ini.

Seperti pada latihan sebelumnya, saat membahas keragaman suatu statistik, angka tersebut disebut sebagai standard error.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di R

Lihat Kursus

Petunjuk latihan

  • Hitung \(\hat{p}\) dan simpan hasilnya ke p_hat. Dalam pemanggilan summarize(), hitung stat sebagai rata-rata dari vote yang bernilai "yes".
  • Temukan suatu interval nilai yang masuk akal untuk parameter sebenarnya dengan menghitung \(\hat{p} \pm 2SE\).
    • Batas lower dari interval kepercayaan adalah p_hat dikurangi dua kali standard error dari stat. Gunakan sd() untuk menghitung standard error.
    • Batas upper adalah p_hat ditambah dua kali standard error dari stat.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# From previous exercises
one_poll <- all_polls %>%
  filter(poll == 1) %>%
  select(vote)
one_poll_boot <- one_poll %>%
  specify(response = vote, success = "yes") %>%
  generate(reps = 1000, type = "bootstrap") %>% 
  calculate(stat = "prop")
  
p_hat <- one_poll %>%
  # Calculate proportion of yes votes
  summarize(stat = ___) %>%
  pull()

# Create an interval of plausible values
one_poll_boot %>%
  summarize(
    # Lower bound is p_hat minus 2 std errs
    lower = ___,
    # Upper bound is p_hat plus 2 std errs
    upper = ___
  )
Edit dan Jalankan Kode