Menyusun CI
Anda telah melihat satu contoh bagaimana p-hat dapat bervariasi saat dilakukan pengambilan sampel ulang, tetapi kita perlu melakukannya berkali-kali untuk mendapatkan perkiraan yang baik atas keragamannya. Di sini Anda akan menghitung distribusi bootstrap penuh untuk memperkirakan standard error (SE) yang akan digunakan membentuk interval kepercayaan. Anda akan menggunakan satu verba tambahan dari infer, calculate(), untuk memudahkan proses menghitung banyak statistik dari banyak himpunan data.
Luangkan waktu sejenak untuk meninjau keluaran dari calculate. Fungsi ini mereduksi data frame Anda menjadi hanya dua kolom: satu untuk "stat" dan satu lagi untuk "replicate" yang bersesuaian.
Saat Anda memplot distribusi bootstrap, Anda akan mendapati bentuknya seperti lonceng. Bentuk inilah yang memungkinkan Anda menambah dan mengurangi dua SE untuk mendapatkan interval 95%.
Latihan ini adalah bagian dari kursus
Inferensi untuk Data Kategorik di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist