Hypothesetoetsen en betrouwbaarheidsintervallen
Zoals aan het begin van dit hoofdstuk al werd genoemd, is er een nauwe link tussen hypothesetoetsen en betrouwbaarheidsintervallen. Bij de eerste kijk je of een bepaalde hypothese over de wereld strookt met je data. Bij de tweede is er geen hypothese: je kwantificeert simpelweg je onzekerheid in je puntschatting door de foutmarge op te tellen en af te trekken.
In deze oefening verken je die dualiteit door een betrouwbaarheidsinterval te maken rond het verschil in proporties, d_hat. Ter herinnering, hieronder staat de code die je gebruikte om de nulverdeling te maken:
# Referentiecode voor nulverdeling
null <- gss2016 %>%
specify(cappun ~ sex, success = "FAVOR") %>%
hypothesize(null = "independence") %>%
generate(reps = 500, type = "permute") %>%
calculate(stat = "diff in props", order = c("FEMALE", "MALE"))`
Deze oefening maakt deel uit van de cursus
Inferentie voor categorische gegevens in R
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Create the bootstrap distribution
___ <- gss2016 %>%
# Specify the variables and success
___ %>%
# Generate 500 bootstrap reps
___ %>%
# Calculate statistics
___