Densidade da randomização
Usar 100 repetições ajuda você a entender o mecanismo de permutação. No entanto, 100 não é suficiente para observar toda a faixa de valores prováveis para as diferenças nulas nas proporções.
Lembre-se das quatro etapas da inferência. São as mesmas quatro etapas que serão usadas em todos os exercícios de inferência neste curso e em cursos futuros de inferência estatística. Use os nomes das funções para ajudar a relembrar o processo de análise.
specifyvai especificar as variáveis resposta e explicativa.hypothesizevai declarar a hipótese nula.generatevai gerar reamostragens, permutações ou simulações.calculatevai calcular as estatísticas-resumo.
Neste exercício, você vai repetir o processo 1000 vezes para ter uma noção da distribuição completa das diferenças nulas nas proporções.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Instruções do exercício
Os pacotes dplyr, ggplot2, NHANES e infer já foram carregados para você.
- Gere 1000 diferenças de proporções embaralhando a variável
HomeOwnusando a sintaxe doinfer. Lembre-se da sintaxe doinfer:specifyque o relacionamento de interesse éHomeOwnvs.Gendere que sucesso, neste contexto, é ser proprietário,success = "Own".hypothesizeque a nula é verdadeira, comnull = "independence"(ou seja, gênero e propriedade de imóvel não estão relacionados).generate1000 permutações; definarepscomo 1000.calculatea estatísticastat = "diff in props"com a ordemc("male", "female").
- Execute o código do gráfico de densidade para criar uma representação visual suavizada da distribuição das diferenças. Que formato a curva tem?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()