NHANES-gegevens opnieuw bemonsteren
De NHANES-gegevens worden verzameld op steekproefeenheden (personen) die specifiek zijn geselecteerd om de Amerikaanse bevolking te vertegenwoordigen. Laten we nhanes_final echter op verschillende manieren opnieuw bemonsteren, zodat je gevoel krijgt voor de verschillende steekproefmethoden.
We kunnen een eenvoudige aselecte steekproef nemen met slice_sample() uit dplyr. Deze functie krijgt als input een gegevensset en een geheel getal voor het aantal te steekproeven rijen.
Gestratificeerd steekproeven kan door group_by() en slice_sample() te combineren. De functie neemt n steekproeven uit elk van de groepen die in group_by() zijn opgegeven.
De cluster()-functie uit het pakket sampling maakt clustersteekproeven. Je geeft de naam van een gegevensset mee, de variabele in de set die als clustervariabele wordt gebruikt (als vector met de naam als string, bijv. c("variable")), een aantal clusters om te selecteren en een methode.
Deze oefening maakt deel uit van de cursus
Experimenteel ontwerp in R
Oefeninstructies
- Gebruik
slice_sample()om 2500 observaties uitnhanes_finalte selecteren en sla dit op alsnhanes_srs. - Maak
nhanes_stratifiedmetgroup_by()enslice_sample(). Stratifeer opriagendren selecteer er 2000 van elk geslacht. Controleer of het gelukt is metcount()om de geslachtsvariabele vannhanes_stratifiedte bekijken. - Laad het
sampling-pakket. Gebruikcluster()omnhanes_finalop te delen naar"indhhin2"in 6 clusters met de methode"srswor". Ken dit toe aannhanes_cluster.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)
# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___
# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")