ComenzarEmpieza gratis

Remuestreo de datos de NHANES

Los datos de NHANES se recogen sobre unidades muestreadas (personas) seleccionadas específicamente para representar a la población de EE. UU. Aun así, vamos a remuestrear el conjunto nhanes_final de distintas maneras para familiarizarnos con los diferentes métodos de muestreo.

Podemos realizar un muestreo aleatorio simple usando slice_sample() de dplyr. Recibe como entrada un conjunto de datos y un entero con el número de filas a muestrear.

El muestreo estratificado se puede hacer combinando group_by() y slice_sample(). La función muestreará n de cada uno de los grupos especificados en group_by().

La función cluster() del paquete sampling crea muestras por conglomerados. Recibe un conjunto de datos, la variable del conjunto que se usará como variable de conglomerado, pasada como un vector con el nombre como cadena (p. ej., c("variable")), un número de conglomerados a seleccionar y un método.

Este ejercicio forma parte del curso

Diseño experimental en R

Ver curso

Instrucciones del ejercicio

  • Usa slice_sample() para seleccionar 2500 observaciones de nhanes_final y guarda el resultado como nhanes_srs.
  • Crea nhanes_stratified usando group_by() y slice_sample(). Estratifica por riagendr y selecciona 2000 de cada género. Confirma que ha funcionado usando count() para examinar la variable de género de nhanes_stratified.
  • Carga el paquete sampling. Usa cluster() para dividir nhanes_final por "indhhin2" en 6 conglomerados utilizando el método "srswor". Asigna el resultado a nhanes_cluster.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)

# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___

# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")
Editar y ejecutar código