Komen de data uit de populatie?
Onthoud dat het geobserveerde verschil (dus het verschil in proporties in de homes-gegevensset, weergegeven als de rode verticale lijn) ongeveer -0.0078 was. Dat lijkt onder het grootste deel van de dichtheid van de geschudde verschillen te vallen. Het is echter belangrijk om te weten of een van de willekeurig gepermuteerde verschillen net zo extreem was als het geobserveerde verschil.
In deze oefening maak je deze dotplot opnieuw als een dichtheidsplot en tel je het aantal gepermuteerde verschillen dat links van het geobserveerde verschil lag.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
De gegevensset homeown_perm is beschikbaar in je werkruimte.
- Plot de gepermuteerde verschillen met
geom_density(). - Voeg een verticale rode lijn toe met
geom_vline()op de positie van het geobserveerde verschil.diff_origis beschikbaar in je werkruimte en staat voor de oorspronkelijke waarde van de verschilstatistiek. - Tel het aantal gepermuteerde verschillen dat kleiner dan of gelijk aan het geobserveerde verschil was.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) +
# Add a density layer
___() +
# Add a vline layer with intercept diff_orig
___(aes(xintercept = ___), color = "red")
# Compare permuted differences to observed difference
homeown_perm %>%
summarize(n_perm_le_obs = sum(___ <= ___))