t de Student para dos muestras

Una prueba t para dos muestras se utiliza para comprobar si las medias de dos poblaciones son iguales.

Ejemplos de análisis que cuantifican el impacto de un factor incluyen probar un fármaco en pacientes o una campaña de marketing en la demanda.

Recuerda que deben cumplirse algunas suposiciones para llevar a cabo una prueba t para dos muestras:

Muestras aleatorias
Observaciones independientes
Datos subyacentes con distribución normal
Homogeneidad de varianzas

Las dos primeras suposiciones deben garantizarse en la fase de diseño del experimento. Las dos últimas suposiciones pueden comprobarse usando la prueba de Shapiro-Wilk y la prueba de Bartlett, respectivamente.

Una empresa te ha proporcionado el data frame df. La columna sample indica la muestra y la columna value contiene datos numéricos. El paquete dplyr está disponible en tu entorno.

Este ejercicio forma parte del curso

Practicing Statistics Interview Questions in R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Return the first part of df
head(___)

# Test normality of sample 1
sample1 <- df %>% filter(sample == ___) %>% select(value) %>% pull()
shapiro.test(___)

# Test normality of sample 2
sample2 <- df %>% filter(sample == 2) %>% select(___) %>% pull()
shapiro.test(___)

Editar y ejecutar código