NHANES-Daten neu sampeln
Die NHANES-Daten werden an Stichprobeneinheiten (Personen) erhoben, die speziell ausgewählt wurden, um die US-Bevölkerung zu repräsentieren. Wir sampeln den Datensatz nhanes_final nun auf verschiedene Arten neu, um ein Gefühl für unterschiedliche Stichprobenverfahren zu bekommen.
Eine einfache Zufallsstichprobe kannst du mit slice_sample() aus dplyr ziehen. Die Funktion nimmt als Eingabe einen Datensatz und eine ganze Zahl für die Anzahl der zu ziehenden Zeilen.
Geschichtetes Sampling erreichst du, indem du group_by() und slice_sample() kombinierst. Die Funktion zieht n Beobachtungen aus jeder in group_by() angegebenen Gruppe.
Die Funktion cluster() aus dem Paket sampling erzeugt Klumpenstichproben. Sie erwartet einen Datensatznamen, die im Datensatz als Klumpenvariable zu verwendende Variable (als Vektor mit dem Namen als String, z. B. c("variable")), eine Anzahl zu wählender Klumpen und eine Methode.
Diese Übung ist Teil des Kurses
Versuchsplanung in R
Anleitung zur Übung
- Verwende
slice_sample(), um 2500 Beobachtungen ausnhanes_finalauszuwählen, und speichere das Ergebnis alsnhanes_srs. - Erstelle
nhanes_stratifiedmitgroup_by()undslice_sample(). Stratifiziere nachriagendrund wähle 2000 pro Geschlecht. Prüfe mitcount(), ob es funktioniert hat, indem du die Geschlechtsvariable vonnhanes_stratifieduntersuchst. - Lade das Paket
sampling. Verwendecluster(), umnhanes_finalnach"indhhin2"in 6 Klumpen mit der Methode"srswor"aufzuteilen. Weise das Ergebnisnhanes_clusterzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)
# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___
# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")