Dampak ukuran sampel pada CI bootstrap

Pada latihan pilihan ganda sebelumnya, Anda mengetahui bahwa jika Anda melakukan resampling data dengan ukuran yang salah (misalnya 300 atau 3, bukan 30), galat baku (SE) dari proporsi sampel menjadi tidak tepat. Dengan 300 observasi hasil resampling, SE terlalu kecil. Dengan 3 observasi hasil resampling, SE terlalu besar.

Di sini, Anda akan menggunakan galat baku yang salah (berdasarkan ukuran sampel yang salah) untuk membuat sebuah selang kepercayaan. Idenya adalah ketika galat baku keliru, selangnya tidak terlalu bermanfaat dan juga tidak benar.

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di R

Instruksi latihan

Sebuah fungsi untuk menghitung selang kepercayaan t hasil bootstrap, calc_t_conf_int(), ditampilkan dalam skrip. Bacalah kodenya dan usahakan untuk memahaminya.
Panggil calc_t_conf_int() pada one_poll_boot untuk menghitung selang kepercayaan t yang benar.
Lakukan hal yang sama pada one_poll_boot_300, untuk menemukan selang yang salah bagi resampling berukuran 300.
Lakukan hal yang sama pada one_poll_boot_3, untuk menemukan selang yang salah bagi resampling berukuran 3.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

calc_t_conf_int <- function(resampled_dataset) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)

# ... and for 300 resamples
___

# ... and for 3 resamples
___

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di R

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Pada bab ini, Anda akan meneliti bagaimana sampel berulang yang diambil dari suatu populasi dapat bervariasi. Variabilitas dalam sampel inilah yang memungkinkan Anda membuat klaim tentang populasi yang diminati. Penting untuk diingat bahwa klaim riset yang menjadi fokus adalah pada populasi, sementara informasi yang tersedia hanya berasal dari data sampel.

Exercise 1: Selamat datang di kursus ini!Exercise 2: Hipotesis (1)Exercise 3: Hipotesis (2)Exercise 4: Distribusi teracak Exercise 5: Bekerja dengan data NHANES Exercise 6: Menghitung statistik yang diminati Exercise 7: Data teracak di bawah model nol independensi Exercise 8: Statistik teracak dan dotplot Exercise 9: Kerapatan pengacakan Exercise 10: Menggunakan sebaran pengacakan Exercise 11: Apakah data berasal dari populasinya?Exercise 12: Apa yang dapat Anda simpulkan?Exercise 13: Kesimpulan studi

Pada bab ini, Anda akan memperoleh perangkat dan pengetahuan untuk menyelesaikan uji hipotesis secara lengkap. Artinya, diberikan sebuah himpunan data, Anda akan mengetahui apakah tepat atau tidak untuk menolak hipotesis nol demi mendukung klaim riset yang diminati.

Exercise 1: Contoh: diskriminasi gender Exercise 2: Hipotesis diskriminasi gender Exercise 3: Merangkum diskriminasi gender Exercise 4: Langkah demi langkah melalui permutasi Exercise 5: Mengacak diskriminasi gender Exercise 6: Distribusi statistik Exercise 7: Merefleksikan analisis Exercise 8: Wilayah kritis Exercise 9: Daerah kritis dua sisi Exercise 10: Mengapa 0,05?Exercise 11: Bagaimana ukuran sampel memengaruhi hasil?Exercise 12: Ukuran sampel dalam distribusi acak Exercise 13: Ukuran sampel untuk wilayah kritis Exercise 14: Apa itu p-value?Exercise 15: Menghitung p-value Exercise 16: Latihan menghitung p-value Exercise 17: Menghitung p-value dua sisi Exercise 18: Ringkasan diskriminasi gender

Anda akan melanjutkan pembelajaran tentang pengujian hipotesis dengan contoh baru dan struktur uji pengacakan yang sama. Namun, pada bab ini fokusnya adalah pada berbagai kesalahan (tipe I dan tipe II), bagaimana kesalahan tersebut terjadi, kapan satu lebih buruk daripada yang lain, serta bagaimana hal seperti ukuran sampel dan besar efek memengaruhi tingkat kesalahan.

Exercise 1: Contoh: biaya peluang Exercise 2: Merangkum biaya peluang (1)Exercise 3: Memplot biaya peluang Exercise 4: Pengacakan biaya peluang Exercise 5: Merangkum opportunity cost (2)Exercise 6: Kesimpulan biaya peluang Exercise 7: Kesalahan dan konsekuensinya Exercise 8: Pilihan laju galat yang berbeda Exercise 9: Galat untuk hipotesis dua sisi Exercise 10: p-value untuk hipotesis dua sisi: biaya peluang Exercise 11: Ringkasan biaya peluang

Sebagai pelengkap pengujian hipotesis, interval kepercayaan memungkinkan Anda memperkirakan parameter populasi. Ingat bahwa ketertarikan Anda selalu pada suatu karakteristik populasi, tetapi Anda hanya memiliki informasi yang tidak lengkap untuk memperkirakan parameter tersebut menggunakan data sampel. Di sini, parameternya adalah proporsi keberhasilan sebenarnya dalam suatu populasi. Bootstrapping digunakan untuk memperkirakan variabilitas yang diperlukan untuk membentuk interval kepercayaan.

Exercise 1: Parameter dan interval kepercayaan Exercise 2: Apa parameter tersebut?Exercise 3: Uji hipotesis atau interval kepercayaan?Exercise 4: Bootstrapping Exercise 5: Pengambilan sampel ulang dari sebuah sampel Exercise 6: Memvisualisasikan variabilitas p-hat Exercise 7: Selalu lakukan resampling dengan jumlah observasi asli Exercise 8: Variabilitas pada p-hat Exercise 9: Aturan Empiris Exercise 10: Interval kepercayaan t dengan bootstrap Exercise 11: Interval persentil bootstrap Exercise 12: Menafsirkan CI dan ketentuan teknis Exercise 13: Dampak ukuran sampel pada CI bootstrap

Latihan Saat Ini

Exercise 14: Dampak nilai proporsi sampel pada selang kepercayaan bootstrap Exercise 15: Dampak persentil pada CI bootstrap Exercise 16: Ringkasan inferensi statistik