Aan de slagGa gratis aan de slag

Komen de data uit de populatie?

Onthoud dat het geobserveerde verschil (dus het verschil in proporties in de homes-gegevensset, weergegeven als de rode verticale lijn) ongeveer -0.0078 was. Dat lijkt onder het grootste deel van de dichtheid van de geschudde verschillen te vallen. Het is echter belangrijk om te weten of een van de willekeurig gepermuteerde verschillen net zo extreem was als het geobserveerde verschil.

In deze oefening maak je deze dotplot opnieuw als een dichtheidsplot en tel je het aantal gepermuteerde verschillen dat links van het geobserveerde verschil lag.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Oefeninstructies

De gegevensset homeown_perm is beschikbaar in je werkruimte.

  • Plot de gepermuteerde verschillen met geom_density().
  • Voeg een verticale rode lijn toe met geom_vline() op de positie van het geobserveerde verschil. diff_orig is beschikbaar in je werkruimte en staat voor de oorspronkelijke waarde van de verschilstatistiek.
  • Tel het aantal gepermuteerde verschillen dat kleiner dan of gelijk aan het geobserveerde verschil was.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) + 
  # Add a density layer
  ___() +
  # Add a vline layer with intercept diff_orig
  ___(aes(xintercept = ___), color = "red")

# Compare permuted differences to observed difference
homeown_perm %>%
  summarize(n_perm_le_obs = sum(___ <= ___))
Code bewerken en uitvoeren