Rééchantillonner les données NHANES
Les données NHANES sont collectées sur des unités échantillonnées (des personnes) sélectionnées spécifiquement pour représenter la population des États‑Unis. Cependant, rééchantillonnons le jeu de données nhanes_final de différentes façons pour nous familiariser avec plusieurs méthodes d’échantillonnage.
Nous pouvons effectuer un échantillon aléatoire simple avec slice_sample() de dplyr. Cette fonction prend en entrée un jeu de données et un entier correspondant au nombre de lignes à échantillonner.
L’échantillonnage stratifié peut se faire en combinant group_by() et slice_sample(). La fonction prélèvera n observations dans chacun des groupes définis par group_by().
La fonction cluster() du package sampling crée des échantillons en grappes. Elle prend en entrée le nom d’un jeu de données, la variable à utiliser comme variable de grappe, passée sous forme de vecteur contenant son nom en chaîne de caractères (par ex. c("variable")), un nombre de grappes à sélectionner et une méthode.
Cet exercice fait partie du cours
Plan d’expériences en R
Instructions
- Utilisez
slice_sample()pour sélectionner 2500 observations denhanes_finalet enregistrez le résultat dansnhanes_srs. - Créez
nhanes_stratifieden utilisantgroup_by()etslice_sample(). Stratifiez parriagendret sélectionnez 2000 observations de chaque genre. Vérifiez que cela a fonctionné aveccount()pour examiner la variable de genre denhanes_stratified. - Chargez le package
sampling. Utilisezcluster()pour divisernhanes_finalpar"indhhin2"en 6 grappes avec la méthode"srswor". Assignez le résultat ànhanes_cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)
# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___
# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")