ComeçarComece de graça

Densidade da randomização

Usar 100 repetições ajuda você a entender o mecanismo de permutação. No entanto, 100 não é suficiente para observar toda a faixa de valores prováveis para as diferenças nulas nas proporções.

Lembre-se das quatro etapas da inferência. São as mesmas quatro etapas que serão usadas em todos os exercícios de inferência neste curso e em cursos futuros de inferência estatística. Use os nomes das funções para ajudar a relembrar o processo de análise.

  • specify vai especificar as variáveis resposta e explicativa.
  • hypothesize vai declarar a hipótese nula.
  • generate vai gerar reamostragens, permutações ou simulações.
  • calculate vai calcular as estatísticas-resumo.

Neste exercício, você vai repetir o processo 1000 vezes para ter uma noção da distribuição completa das diferenças nulas nas proporções.

Este exercício faz parte do curso

Fundamentos de Inferência em R

Ver curso

Instruções do exercício

Os pacotes dplyr, ggplot2, NHANES e infer já foram carregados para você.

  • Gere 1000 diferenças de proporções embaralhando a variável HomeOwn usando a sintaxe do infer. Lembre-se da sintaxe do infer:
    • specify que o relacionamento de interesse é HomeOwn vs. Gender e que sucesso, neste contexto, é ser proprietário, success = "Own".
    • hypothesize que a nula é verdadeira, com null = "independence" (ou seja, gênero e propriedade de imóvel não estão relacionados).
    • generate 1000 permutações; defina reps como 1000.
    • calculate a estatística stat = "diff in props" com a ordem c("male", "female").
  • Execute o código do gráfico de densidade para criar uma representação visual suavizada da distribuição das diferenças. Que formato a curva tem?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform 1000 permutations
homeown_perm <- homes %>%
  # Specify HomeOwn vs. Gender, with `"Own" as success
  ___(___ ~ ___, success = "___") %>%
  # Use a null hypothesis of independence
  ___(___) %>% 
  # Generate 1000 repetitions (by permutation)
  ___(reps = ___, type = "permute") %>% 
  # Calculate the difference in proportions (male then female)
  ___(___, order = ___))

# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) + 
  geom_density()
Editar e executar o código