Kerapatan pengacakan
Menggunakan 100 pengulangan membantu Anda memahami mekanisme pengacakan (permuting). Namun, 100 belum cukup untuk mengamati seluruh rentang nilai yang mungkin untuk selisih proporsi nol.
Ingat kembali empat langkah inferensi. Ini adalah empat langkah yang sama yang akan digunakan di semua latihan inferensi dalam kursus ini dan kursus inferensi statistik berikutnya. Gunakan nama fungsi untuk membantu Anda mengingat proses analisis.
specifyakan menentukan variabel respons dan penjelas.hypothesizeakan menyatakan hipotesis nol.generateakan menghasilkan sampel ulang, permutasi, atau simulasi.calculateakan menghitung statistik ringkas.
Dalam latihan ini, Anda akan mengulangi prosesnya 1000 kali untuk memperoleh gambaran distribusi lengkap dari selisih proporsi nol.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Petunjuk latihan
Paket dplyr, ggplot2, NHANES, dan infer sudah dimuat untuk Anda.
- Hasilkan 1000 selisih proporsi dengan mengacak variabel
HomeOwnmenggunakan sintaksinfer. Ingat sintaksinfer:specifybahwa hubungan yang diminati adalahHomeOwnvs.Genderdan keberhasilan dalam konteks ini adalah kepemilikan rumah,success = "Own".hypothesizebahwa hipotesis nol benar dengannull = "independence"(artinya gender dan kepemilikan rumah tidak berhubungan).generate1000 permutasi; aturrepske 1000.calculatestatistikstat = "diff in props"dengan urutanc("male", "female").
- Jalankan kode plot kerapatan untuk membuat representasi visual yang dihaluskan dari distribusi selisih. Seperti apa bentuk kurvanya?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()