Passo a passo da permutação
Para ajudar você a entender o código usado para criar a distribuição de randomização, este exercício vai conduzi-lo pelos passos do framework infer. Em especial, você verá como as diferenças nas réplicas geradas afetam as estatísticas calculadas.
Depois de executar os passos do infer, repare que os números são levemente diferentes em cada réplica.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Instruções do exercício
Os pacotes dplyr e infer já foram carregados para você, junto com o data frame disc do último exercício.
- Chame as funções para os três primeiros passos. O trabalho já foi feito, sua tarefa é investigar os resultados de chamar os três primeiros passos do
infer. - Para ver o efeito da permutação,
- agrupe o data frame permutado,
disc_perm, pela nova variávelreplicatee, em seguida, - conte as variáveis de interesse (
promotedentro de cadasex) usandocount().
- agrupe o data frame permutado,
- Usando
disc_perm, usecalculate()para obter a estatística de interesse. Definastatcomo"diff in props"eordercomoc("male", "female").
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___