Interval kepercayaan t dengan bootstrap

Latihan sebelumnya memberi Anda dua hal:

Anda dapat mengukur keragaman yang terkait dengan \(\hat{p}\) dengan melakukan resampling dari sampel asli.
Setelah Anda mengetahui keragaman \(\hat{p}\), Anda dapat menggunakannya untuk mengukur seberapa jauh proporsi sebenarnya.

Perhatikan bahwa tingkat kedekatan (di sini 95%) mengacu pada seberapa sering suatu sampel terpilih sehingga dekat dengan parameter populasi. Anda tidak akan pernah tahu apakah suatu himpunan data tertentu dekat atau jauh dari parameter, tetapi Anda tahu bahwa sepanjang waktu, 95% sampel yang Anda kumpulkan seharusnya menghasilkan taksiran yang berada dalam \(2SE\) dari parameter populasi sebenarnya.

Suara dari satu jajak pendapat, one_poll, dan data dari 1000 resampling bootstrap, one_poll_boot, tersedia di ruang kerja Anda. Keduanya didasarkan pada Eksperimen 2 dari awal bab ini.

Seperti pada latihan sebelumnya, saat membahas keragaman suatu statistik, angka tersebut disebut sebagai standard error.

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di R

Instruksi latihan

Hitung \(\hat{p}\) dan simpan hasilnya ke p_hat. Dalam pemanggilan summarize(), hitung stat sebagai rata-rata dari vote yang bernilai "yes".
Temukan suatu interval nilai yang masuk akal untuk parameter sebenarnya dengan menghitung \(\hat{p} \pm 2SE\).
- Batas lower dari interval kepercayaan adalah p_hat dikurangi dua kali standard error dari stat. Gunakan sd() untuk menghitung standard error.
- Batas upper adalah p_hat ditambah dua kali standard error dari stat.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# From previous exercises
one_poll <- all_polls %>%
  filter(poll == 1) %>%
  select(vote)
one_poll_boot <- one_poll %>%
  specify(response = vote, success = "yes") %>%
  generate(reps = 1000, type = "bootstrap") %>% 
  calculate(stat = "prop")
  
p_hat <- one_poll %>%
  # Calculate proportion of yes votes
  summarize(stat = ___) %>%
  pull()

# Create an interval of plausible values
one_poll_boot %>%
  summarize(
    # Lower bound is p_hat minus 2 std errs
    lower = ___,
    # Upper bound is p_hat plus 2 std errs
    upper = ___
  )

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di R

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Pada bab ini, Anda akan meneliti bagaimana sampel berulang yang diambil dari suatu populasi dapat bervariasi. Variabilitas dalam sampel inilah yang memungkinkan Anda membuat klaim tentang populasi yang diminati. Penting untuk diingat bahwa klaim riset yang menjadi fokus adalah pada populasi, sementara informasi yang tersedia hanya berasal dari data sampel.

Exercise 1: Selamat datang di kursus ini!Exercise 2: Hipotesis (1)Exercise 3: Hipotesis (2)Exercise 4: Distribusi teracak Exercise 5: Bekerja dengan data NHANES Exercise 6: Menghitung statistik yang diminati Exercise 7: Data teracak di bawah model nol independensi Exercise 8: Statistik teracak dan dotplot Exercise 9: Kerapatan pengacakan Exercise 10: Menggunakan sebaran pengacakan Exercise 11: Apakah data berasal dari populasinya?Exercise 12: Apa yang dapat Anda simpulkan?Exercise 13: Kesimpulan studi

Pada bab ini, Anda akan memperoleh perangkat dan pengetahuan untuk menyelesaikan uji hipotesis secara lengkap. Artinya, diberikan sebuah himpunan data, Anda akan mengetahui apakah tepat atau tidak untuk menolak hipotesis nol demi mendukung klaim riset yang diminati.

Exercise 1: Contoh: diskriminasi gender Exercise 2: Hipotesis diskriminasi gender Exercise 3: Merangkum diskriminasi gender Exercise 4: Langkah demi langkah melalui permutasi Exercise 5: Mengacak diskriminasi gender Exercise 6: Distribusi statistik Exercise 7: Merefleksikan analisis Exercise 8: Wilayah kritis Exercise 9: Daerah kritis dua sisi Exercise 10: Mengapa 0,05?Exercise 11: Bagaimana ukuran sampel memengaruhi hasil?Exercise 12: Ukuran sampel dalam distribusi acak Exercise 13: Ukuran sampel untuk wilayah kritis Exercise 14: Apa itu p-value?Exercise 15: Menghitung p-value Exercise 16: Latihan menghitung p-value Exercise 17: Menghitung p-value dua sisi Exercise 18: Ringkasan diskriminasi gender

Anda akan melanjutkan pembelajaran tentang pengujian hipotesis dengan contoh baru dan struktur uji pengacakan yang sama. Namun, pada bab ini fokusnya adalah pada berbagai kesalahan (tipe I dan tipe II), bagaimana kesalahan tersebut terjadi, kapan satu lebih buruk daripada yang lain, serta bagaimana hal seperti ukuran sampel dan besar efek memengaruhi tingkat kesalahan.

Exercise 1: Contoh: biaya peluang Exercise 2: Merangkum biaya peluang (1)Exercise 3: Memplot biaya peluang Exercise 4: Pengacakan biaya peluang Exercise 5: Merangkum opportunity cost (2)Exercise 6: Kesimpulan biaya peluang Exercise 7: Kesalahan dan konsekuensinya Exercise 8: Pilihan laju galat yang berbeda Exercise 9: Galat untuk hipotesis dua sisi Exercise 10: p-value untuk hipotesis dua sisi: biaya peluang Exercise 11: Ringkasan biaya peluang

Sebagai pelengkap pengujian hipotesis, interval kepercayaan memungkinkan Anda memperkirakan parameter populasi. Ingat bahwa ketertarikan Anda selalu pada suatu karakteristik populasi, tetapi Anda hanya memiliki informasi yang tidak lengkap untuk memperkirakan parameter tersebut menggunakan data sampel. Di sini, parameternya adalah proporsi keberhasilan sebenarnya dalam suatu populasi. Bootstrapping digunakan untuk memperkirakan variabilitas yang diperlukan untuk membentuk interval kepercayaan.

Exercise 1: Parameter dan interval kepercayaan Exercise 2: Apa parameter tersebut?Exercise 3: Uji hipotesis atau interval kepercayaan?Exercise 4: Bootstrapping Exercise 5: Pengambilan sampel ulang dari sebuah sampel Exercise 6: Memvisualisasikan variabilitas p-hat Exercise 7: Selalu lakukan resampling dengan jumlah observasi asli Exercise 8: Variabilitas pada p-hat Exercise 9: Aturan Empiris Exercise 10: Interval kepercayaan t dengan bootstrap

Latihan Saat Ini

Exercise 11: Interval persentil bootstrap Exercise 12: Menafsirkan CI dan ketentuan teknis Exercise 13: Dampak ukuran sampel pada CI bootstrap Exercise 14: Dampak nilai proporsi sampel pada selang kepercayaan bootstrap Exercise 15: Dampak persentil pada CI bootstrap Exercise 16: Ringkasan inferensi statistik