MulaiMulai sekarang secara gratis

Dampak ukuran sampel pada CI bootstrap

Pada latihan pilihan ganda sebelumnya, Anda mengetahui bahwa jika Anda melakukan resampling data dengan ukuran yang salah (misalnya 300 atau 3, bukan 30), galat baku (SE) dari proporsi sampel menjadi tidak tepat. Dengan 300 observasi hasil resampling, SE terlalu kecil. Dengan 3 observasi hasil resampling, SE terlalu besar.

Di sini, Anda akan menggunakan galat baku yang salah (berdasarkan ukuran sampel yang salah) untuk membuat sebuah selang kepercayaan. Idenya adalah ketika galat baku keliru, selangnya tidak terlalu bermanfaat dan juga tidak benar.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di R

Lihat Kursus

Petunjuk latihan

  • Sebuah fungsi untuk menghitung selang kepercayaan t hasil bootstrap, calc_t_conf_int(), ditampilkan dalam skrip. Bacalah kodenya dan usahakan untuk memahaminya.
  • Panggil calc_t_conf_int() pada one_poll_boot untuk menghitung selang kepercayaan t yang benar.
  • Lakukan hal yang sama pada one_poll_boot_300, untuk menemukan selang yang salah bagi resampling berukuran 300.
  • Lakukan hal yang sama pada one_poll_boot_3, untuk menemukan selang yang salah bagi resampling berukuran 3.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

calc_t_conf_int <- function(resampled_dataset) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)

# ... and for 300 resamples
___

# ... and for 3 resamples
___
Edit dan Jalankan Kode