Hypothesetoetsen en betrouwbaarheidsintervallen

Zoals aan het begin van dit hoofdstuk al werd genoemd, is er een nauwe link tussen hypothesetoetsen en betrouwbaarheidsintervallen. Bij de eerste kijk je of een bepaalde hypothese over de wereld strookt met je data. Bij de tweede is er geen hypothese: je kwantificeert simpelweg je onzekerheid in je puntschatting door de foutmarge op te tellen en af te trekken.

In deze oefening verken je die dualiteit door een betrouwbaarheidsinterval te maken rond het verschil in proporties, d_hat. Ter herinnering, hieronder staat de code die je gebruikte om de nulverdeling te maken:

# Referentiecode voor nulverdeling
null <- gss2016 %>%
   specify(cappun ~ sex, success = "FAVOR") %>%
   hypothesize(null = "independence") %>%
   generate(reps = 500, type = "permute") %>%
   calculate(stat = "diff in props", order = c("FEMALE", "MALE"))`

Deze oefening maakt deel uit van de cursus

Inferentie voor categorische gegevens in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the bootstrap distribution
___ <- gss2016 %>%
  # Specify the variables and success
  ___ %>%
  # Generate 500 bootstrap reps
  ___ %>%
  # Calculate statistics
  ___

Code bewerken en uitvoeren