I dati provengono dalla popolazione?
Ricorda che la differenza osservata (cioè la differenza nelle proporzioni nel dataset homes, mostrata come linea verticale rossa) era circa -0,0078, e sembra cadere al di sotto della maggior parte della densità delle differenze mescolate. È però importante sapere se qualcuna delle differenze permutate casualmente è stata estrema quanto la differenza osservata.
In questo esercizio, ricreerai questo dotplot come un grafico di densità e conterai quante differenze permutate si trovano a sinistra della differenza osservata.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
Il dataset homeown_perm è disponibile nel tuo ambiente di lavoro.
- Usando
geom_density(), traccia le differenze permutate. - Aggiungi una linea verticale rossa con
geom_vline()in corrispondenza della differenza osservata.diff_origè fornito nel tuo ambiente di lavoro e rappresenta il valore originale della statistica di differenza. - Conta il numero di differenze permutate che erano minori o uguali alla differenza osservata.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) +
# Add a density layer
___() +
# Add a vline layer with intercept diff_orig
___(aes(xintercept = ___), color = "red")
# Compare permuted differences to observed difference
homeown_perm %>%
summarize(n_perm_le_obs = sum(___ <= ___))