De statistiek van interesse berekenen
Met de NHANES-gegevensset onderzoeken we de relatie tussen geslacht en huiseigendom. Meer informatie over de gegevensset vind je hier: NHANES.
Zoals je in de video zag, kun je natuurlijke variabiliteit modelleren door observaties te husselen om zo eventuele verbanden in de populatie weg te nemen. Maar voordat je de data permuteert, moet je eerst de oorspronkelijk geobserveerde statistiek berekenen. In deze oefening bereken je het verschil in proportie huiseigenaars tussen mannen en vrouwen.
Onthoud dat:
%in%een logische vector teruggeeft dieTRUEis wanneer waarden aan de linkerkant voorkomen aan de rechterkant.- Het gemiddelde van een logische vector gelijk is aan de proportie gevallen waarvoor die vector
TRUEis.
fruits <- c("apple", "banana", "cherry")
fruits %in% c("banana", "cherry")
mean(fruits %in% c("banana", "cherry"))
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
homes <- NHANES %>%
# Select Gender and HomeOwn
___(___, ___) %>%
# Filter for HomeOwn equal to "Own" or "Rent"
___(___ %in% c("___", "___"))