Resumindo o custo de oportunidade (2)

Agora que você criou a distribuição por randomização, vai usá-la para avaliar se a diferença observada nas proporções é consistente com a diferença nula. Você vai medir essa consistência (ou a falta dela) com um valor de p, ou a proporção de diferenças permutadas menores ou iguais à diferença observada.

O conjunto de dados permutado e a estatística observada original estão disponíveis no seu ambiente como opp_perm e diff_orig, respectivamente.

Use visualize e get_p_value com as funções nativas do infer. Lembre-se de que as estatísticas nulas ficam acima da diferença original, então o valor de p (que representa com que frequência um valor nulo é mais extremo) é calculado contando o número de valores nulos que são less do que a diferença original.

Este exercício faz parte do curso

Fundamentos de Inferência em R

Ver curso

Instruções do exercício

Primeiro, visualize a distribuição amostral das estatísticas permutadas indicando o ponto onde obs_stat = diff_orig e preenchendo os valores abaixo com o comando direction = "less".
Em seguida, get_p_value é calculado como a proporção de estatísticas permutadas que são direction = "less" do que obs_stat = diff_orig.
Como alternativa para calcular o valor de p, use summarize() e mean() para encontrar a proporção de vezes em que as diferenças permutadas em opp_perm (chamadas de stat) são menores ou iguais à diferença observada (chamada de diff_orig).
Você pode testar seu conhecimento experimentando: direction = "greater", direction = "two_sided" e direction = "less" antes de enviar sua resposta tanto para visualize quanto para get_p_value.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Visualize the statistic 
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `get_p_value`
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `summarize`
opp_perm %>%
  summarize(p_value = ___)

Editar e executar o código