Teste t de duas amostras
Um teste t de duas amostras é usado para verificar se as médias de duas populações são iguais.
Exemplos de análises que quantificam o impacto de um fator incluem testar um medicamento em pacientes ou uma campanha de marketing na demanda.
Lembre-se de que algumas suposições precisam ser atendidas para realizar um teste t de duas amostras:
- Amostras aleatórias
- Observações independentes
- Dados subjacentes com distribuição normal
- Homogeneidade de variâncias
As duas primeiras suposições devem ser atendidas na fase de desenho do experimento. As duas últimas suposições podem ser testadas usando o teste de Shapiro-Wilk e o teste de Bartlett, respectivamente.
Uma empresa forneceu para você o data frame df. A coluna sample indica a amostra, e a coluna value contém dados numéricos. O pacote dplyr está disponível no seu ambiente.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Estatística em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Return the first part of df
head(___)
# Test normality of sample 1
sample1 <- df %>% filter(sample == ___) %>% select(value) %>% pull()
shapiro.test(___)
# Test normality of sample 2
sample2 <- df %>% filter(sample == 2) %>% select(___) %>% pull()
shapiro.test(___)