Menyusun CI

Anda telah melihat satu contoh bagaimana p-hat dapat bervariasi saat dilakukan pengambilan sampel ulang, tetapi kita perlu melakukannya berkali-kali untuk mendapatkan perkiraan yang baik atas keragamannya. Di sini Anda akan menghitung distribusi bootstrap penuh untuk memperkirakan standard error (SE) yang akan digunakan membentuk interval kepercayaan. Anda akan menggunakan satu verba tambahan dari infer, calculate(), untuk memudahkan proses menghitung banyak statistik dari banyak himpunan data.

Luangkan waktu sejenak untuk meninjau keluaran dari calculate. Fungsi ini mereduksi data frame Anda menjadi hanya dua kolom: satu untuk "stat" dan satu lagi untuk "replicate" yang bersesuaian.

Saat Anda memplot distribusi bootstrap, Anda akan mendapati bentuknya seperti lonceng. Bentuk inilah yang memungkinkan Anda menambah dan mengurangi dua SE untuk mendapatkan interval 95%.

Latihan ini merupakan bagian dari kursus

Inferensi untuk Data Kategorik di R

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
  # Specify the response and success
  specify(response = ___, ___ = "___") %>%
  # Generate 500 bootstrap reps
  generate(___ = ___, type = "bootstrap") %>%
  # Calculate proportions
  calculate(stat = "___")

# See the result
boot_dist

Edit dan Jalankan Kode