Calculando os p-values
No vídeo, você viu que o p-value mede o grau de discordância entre os dados e a hipótese nula. Aqui, você vai calcular o p-value para o conjunto de dados original de discriminação e também para as versões pequena e grande, disc_small e disc_big.
As diferenças originais nas proporções estão disponíveis no seu ambiente de trabalho: diff_orig, diff_orig_small e diff_orig_big, assim como os conjuntos permutados, disc_perm, disc_perm_small e disc_perm_big.
Lembre que aqui você está interessado apenas no teste de hipótese unilateral. Ou seja, você quer responder à pergunta: "Homens têm mais probabilidade de serem promovidos do que mulheres?"
Este exercício faz parte do curso
Fundamentos de Inferência em R
Instruções do exercício
- Use
visualize()eget_p_value()das funções internas doinfer. Lembre-se de que as estatísticas sob a nula ficam abaixo da diferença original, então o p-value (que representa com que frequência um valor sob a nula é mais "extremo") é calculado contando quantos valores nulos sãogreaterdo que a diferença original. - Repita para o conjunto pequeno,
disc_perm_small, que tem diferença observadadiff_orig_small. - Repita para o conjunto grande,
disc_perm_big, que tem diferença observadadiff_orig_big. - Você pode testar seus conhecimentos experimentando:
direction = "greater",direction = "two_sided"edirection = "less"antes de Enviar Resposta.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)