t de Student para dos muestras
Una prueba t para dos muestras se utiliza para comprobar si las medias de dos poblaciones son iguales.
Ejemplos de análisis que cuantifican el impacto de un factor incluyen probar un fármaco en pacientes o una campaña de marketing en la demanda.
Recuerda que deben cumplirse algunas suposiciones para llevar a cabo una prueba t para dos muestras:
- Muestras aleatorias
- Observaciones independientes
- Datos subyacentes con distribución normal
- Homogeneidad de varianzas
Las dos primeras suposiciones deben garantizarse en la fase de diseño del experimento. Las dos últimas suposiciones pueden comprobarse usando la prueba de Shapiro-Wilk y la prueba de Bartlett, respectivamente.
Una empresa te ha proporcionado el data frame df. La columna sample indica la muestra y la columna value contiene datos numéricos. El paquete dplyr está disponible en tu entorno.
Este ejercicio forma parte del curso
Practicing Statistics Interview Questions in R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Return the first part of df
head(___)
# Test normality of sample 1
sample1 <- df %>% filter(sample == ___) %>% select(value) %>% pull()
shapiro.test(___)
# Test normality of sample 2
sample2 <- df %>% filter(sample == 2) %>% select(___) %>% pull()
shapiro.test(___)