Aan de slagGa gratis aan de slag

De statistiek van interesse berekenen

Met de NHANES-gegevensset onderzoeken we de relatie tussen geslacht en huiseigendom. Meer informatie over de gegevensset vind je hier: NHANES.

Zoals je in de video zag, kun je natuurlijke variabiliteit modelleren door observaties te husselen om zo eventuele verbanden in de populatie weg te nemen. Maar voordat je de data permuteert, moet je eerst de oorspronkelijk geobserveerde statistiek berekenen. In deze oefening bereken je het verschil in proportie huiseigenaars tussen mannen en vrouwen.

Onthoud dat:

  • %in% een logische vector teruggeeft die TRUE is wanneer waarden aan de linkerkant voorkomen aan de rechterkant.
  • Het gemiddelde van een logische vector gelijk is aan de proportie gevallen waarvoor die vector TRUE is.
fruits <- c("apple", "banana", "cherry")
fruits %in% c("banana", "cherry")
mean(fruits %in% c("banana", "cherry"))

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

homes <- NHANES %>%
  # Select Gender and HomeOwn
  ___(___, ___) %>%
  # Filter for HomeOwn equal to "Own" or "Rent"
  ___(___ %in% c("___", "___"))
Code bewerken en uitvoeren