Apakah data berasal dari populasinya?
Ingat bahwa selisih teramati (yaitu selisih proporsi pada himpunan data homes, ditunjukkan sebagai garis vertikal merah) sekitar -0,0078, yang tampaknya berada di bawah sebagian besar kerapatan dari selisih yang diacak. Namun, penting untuk mengetahui apakah ada selisih yang dipermutasi secara acak yang sama ekstremnya dengan selisih teramati tersebut.
Dalam latihan ini, Anda akan membuat ulang dotplot ini sebagai plot kerapatan dan menghitung jumlah selisih terpermusi yang berada di sebelah kiri selisih teramati.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di R
Petunjuk latihan
Himpunan data homeown_perm tersedia di workspace Anda.
- Dengan
geom_density(), plot selisih yang dipermutasi. - Tambahkan garis vertikal merah dengan
geom_vline()pada posisi selisih teramati.diff_origdisediakan di workspace Anda dan merepresentasikan nilai asli dari statistik selisih. - Hitung jumlah selisih yang dipermutasi yang kurang dari atau sama dengan selisih teramati.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) +
# Add a density layer
___() +
# Add a vline layer with intercept diff_orig
___(aes(xintercept = ___), color = "red")
# Compare permuted differences to observed difference
homeown_perm %>%
summarize(n_perm_le_obs = sum(___ <= ___))