Resumindo o custo de oportunidade (2)
Agora que você criou a distribuição por randomização, vai usá-la para avaliar se a diferença observada nas proporções é consistente com a diferença nula. Você vai medir essa consistência (ou a falta dela) com um valor de p, ou a proporção de diferenças permutadas menores ou iguais à diferença observada.
O conjunto de dados permutado e a estatística observada original estão disponíveis no seu ambiente como opp_perm e diff_orig, respectivamente.
Use visualize e get_p_value com as funções nativas do infer. Lembre-se de que as estatísticas nulas ficam acima da diferença original, então o valor de p (que representa com que frequência um valor nulo é mais extremo) é calculado contando o número de valores nulos que são less do que a diferença original.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Instruções do exercício
- Primeiro,
visualizea distribuição amostral das estatísticas permutadas indicando o ponto ondeobs_stat = diff_orige preenchendo os valores abaixo com o comandodirection = "less". - Em seguida,
get_p_valueé calculado como a proporção de estatísticas permutadas que sãodirection = "less"do queobs_stat = diff_orig. - Como alternativa para calcular o valor de p, use
summarize()emean()para encontrar a proporção de vezes em que as diferenças permutadas emopp_perm(chamadas destat) são menores ou iguais à diferença observada (chamada dediff_orig). - Você pode testar seu conhecimento experimentando:
direction = "greater",direction = "two_sided"edirection = "less"antes de enviar sua resposta tanto paravisualizequanto paraget_p_value.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)