Estatísticas randomizadas e gráfico de pontos
Ao permutar a variável de propriedade do imóvel várias vezes, você gera diferenças nas proporções que são consistentes com a suposição de que as variáveis não estão relacionadas. A estatística de interesse é a diferença nas proporções, dada por stat = "diff in props". Depois de calcular as estatísticas randomizadas, você vai representá-las em um gráfico de pontos.
Este exercício mostra as quatro etapas do pacote infer:
specifyespecifica as variáveis resposta e explicativa.hypothesizedeclara a hipótese nula.generategera reamostragens, permutações ou simulações.calculatecalcula estatísticas de resumo.
Cada etapa será abordada ao longo do curso; neste exercício, você vai escrever o código para calculate().
Os pacotes dplyr, ggplot2, NHANES e infer já foram carregados para você. Repita a permutação e a visualização com 100 diferenças nas proporções geradas embaralhando a variável HomeOwn.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform 100 permutations
homeown_perm <- homes %>%
specify(HomeOwn ~ Gender, success = "Own") %>%
hypothesize(null = "independence") %>%
generate(reps = 100, type = "permute") %>%
___(___, order = ___)
# Print results to console
homeown_perm