CommencerCommencer gratuitement

Rééchantillonner les données NHANES

Les données NHANES sont collectées sur des unités échantillonnées (des personnes) sélectionnées spécifiquement pour représenter la population des États‑Unis. Cependant, rééchantillonnons le jeu de données nhanes_final de différentes façons pour nous familiariser avec plusieurs méthodes d’échantillonnage.

Nous pouvons effectuer un échantillon aléatoire simple avec slice_sample() de dplyr. Cette fonction prend en entrée un jeu de données et un entier correspondant au nombre de lignes à échantillonner.

L’échantillonnage stratifié peut se faire en combinant group_by() et slice_sample(). La fonction prélèvera n observations dans chacun des groupes définis par group_by().

La fonction cluster() du package sampling crée des échantillons en grappes. Elle prend en entrée le nom d’un jeu de données, la variable à utiliser comme variable de grappe, passée sous forme de vecteur contenant son nom en chaîne de caractères (par ex. c("variable")), un nombre de grappes à sélectionner et une méthode.

Cet exercice fait partie du cours

Plan d’expériences en R

Afficher le cours

Instructions

  • Utilisez slice_sample() pour sélectionner 2500 observations de nhanes_final et enregistrez le résultat dans nhanes_srs.
  • Créez nhanes_stratified en utilisant group_by() et slice_sample(). Stratifiez par riagendr et sélectionnez 2000 observations de chaque genre. Vérifiez que cela a fonctionné avec count() pour examiner la variable de genre de nhanes_stratified.
  • Chargez le package sampling. Utilisez cluster() pour diviser nhanes_final par "indhhin2" en 6 grappes avec la méthode "srswor". Assignez le résultat à nhanes_cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)

# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___

# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")
Modifier et exécuter le code