MulaiMulai sekarang secara gratis

Kerapatan pengacakan

Menggunakan 100 pengulangan membantu Anda memahami mekanisme pengacakan (permuting). Namun, 100 belum cukup untuk mengamati seluruh rentang nilai yang mungkin untuk selisih proporsi nol.

Ingat kembali empat langkah inferensi. Ini adalah empat langkah yang sama yang akan digunakan di semua latihan inferensi dalam kursus ini dan kursus inferensi statistik berikutnya. Gunakan nama fungsi untuk membantu Anda mengingat proses analisis.

  • specify akan menentukan variabel respons dan penjelas.
  • hypothesize akan menyatakan hipotesis nol.
  • generate akan menghasilkan sampel ulang, permutasi, atau simulasi.
  • calculate akan menghitung statistik ringkas.

Dalam latihan ini, Anda akan mengulangi prosesnya 1000 kali untuk memperoleh gambaran distribusi lengkap dari selisih proporsi nol.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di R

Lihat Kursus

Petunjuk latihan

Paket dplyr, ggplot2, NHANES, dan infer sudah dimuat untuk Anda.

  • Hasilkan 1000 selisih proporsi dengan mengacak variabel HomeOwn menggunakan sintaks infer. Ingat sintaks infer:
    • specify bahwa hubungan yang diminati adalah HomeOwn vs. Gender dan keberhasilan dalam konteks ini adalah kepemilikan rumah, success = "Own".
    • hypothesize bahwa hipotesis nol benar dengan null = "independence" (artinya gender dan kepemilikan rumah tidak berhubungan).
    • generate 1000 permutasi; atur reps ke 1000.
    • calculate statistik stat = "diff in props" dengan urutan c("male", "female").
  • Jalankan kode plot kerapatan untuk membuat representasi visual yang dihaluskan dari distribusi selisih. Seperti apa bentuk kurvanya?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform 1000 permutations
homeown_perm <- homes %>%
  # Specify HomeOwn vs. Gender, with `"Own" as success
  ___(___ ~ ___, success = "___") %>%
  # Use a null hypothesis of independence
  ___(___) %>% 
  # Generate 1000 repetitions (by permutation)
  ___(reps = ___, type = "permute") %>% 
  # Calculate the difference in proportions (male then female)
  ___(___, order = ___))

# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) + 
  geom_density()
Edit dan Jalankan Kode