Remuestreo de datos de NHANES
Los datos de NHANES se recogen sobre unidades muestreadas (personas) seleccionadas específicamente para representar a la población de EE. UU. Aun así, vamos a remuestrear el conjunto nhanes_final de distintas maneras para familiarizarnos con los diferentes métodos de muestreo.
Podemos realizar un muestreo aleatorio simple usando slice_sample() de dplyr. Recibe como entrada un conjunto de datos y un entero con el número de filas a muestrear.
El muestreo estratificado se puede hacer combinando group_by() y slice_sample(). La función muestreará n de cada uno de los grupos especificados en group_by().
La función cluster() del paquete sampling crea muestras por conglomerados. Recibe un conjunto de datos, la variable del conjunto que se usará como variable de conglomerado, pasada como un vector con el nombre como cadena (p. ej., c("variable")), un número de conglomerados a seleccionar y un método.
Este ejercicio forma parte del curso
Diseño experimental en R
Instrucciones del ejercicio
- Usa
slice_sample()para seleccionar 2500 observaciones denhanes_finaly guarda el resultado comonhanes_srs. - Crea
nhanes_stratifiedusandogroup_by()yslice_sample(). Estratifica porriagendry selecciona 2000 de cada género. Confirma que ha funcionado usandocount()para examinar la variable de género denhanes_stratified. - Carga el paquete
sampling. Usacluster()para dividirnhanes_finalpor"indhhin2"en 6 conglomerados utilizando el método"srswor". Asigna el resultado anhanes_cluster.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)
# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___
# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")