ComeçarComece de graça

Estatísticas randomizadas e gráfico de pontos

Ao permutar a variável de propriedade do imóvel várias vezes, você gera diferenças nas proporções que são consistentes com a suposição de que as variáveis não estão relacionadas. A estatística de interesse é a diferença nas proporções, dada por stat = "diff in props". Depois de calcular as estatísticas randomizadas, você vai representá-las em um gráfico de pontos.

Este exercício mostra as quatro etapas do pacote infer:

  • specify especifica as variáveis resposta e explicativa.
  • hypothesize declara a hipótese nula.
  • generate gera reamostragens, permutações ou simulações.
  • calculate calcula estatísticas de resumo.

Cada etapa será abordada ao longo do curso; neste exercício, você vai escrever o código para calculate().

Os pacotes dplyr, ggplot2, NHANES e infer já foram carregados para você. Repita a permutação e a visualização com 100 diferenças nas proporções geradas embaralhando a variável HomeOwn.

Este exercício faz parte do curso

Fundamentos de Inferência em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform 100 permutations
homeown_perm <- homes %>%
  specify(HomeOwn ~ Gender, success = "Own") %>%
  hypothesize(null = "independence") %>% 
  generate(reps = 100, type = "permute") %>% 
  ___(___, order = ___)
  
# Print results to console
homeown_perm
Editar e executar o código