Teste de aderência (goodness of fit)
A hipótese nula em um teste de aderência é uma lista de valores específicos de parâmetro para cada proporção. Na sua análise, a hipótese equivalente é que a Lei de Benford se aplica à distribuição dos primeiros dígitos das contagens totais de votos no nível das cidades. Você poderia escrever assim:
$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$
Em que \(p_1\) é a altura da primeira barra no gráfico de barras de Benford. A hipótese alternativa é que pelo menos uma dessas proporções é diferente; isto é, que a distribuição do primeiro dígito não segue a Lei de Benford.
Neste exercício, você vai usar simulação para construir a distribuição nula dos tipos de estatísticas qui-quadrado que seriam observadas se, de fato, essas contagens seguissem a Lei de Benford.
Este exercício faz parte do curso
Inferência para Dados Categóricos em R
Instruções do exercício
- Inspecione
p_benfordimprimindo-o na tela. - Começando com
iran, calcule a estatística qui-quadrado usandochisq_stat. Observe que você deve especificar a variável no data frame que servirá como resposta, bem como o vetor de probabilidades ao qual deseja compará-la. - Construa uma distribuição nula com 500 amostras da estatística
Chisqpor simulação sob a hipótese nulapointde que o vetor de proporçõespép_benford. Salve as estatísticas resultantes comonull.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Inspect p_benford
p_benford
# Compute observed stat
chi_obs_stat <- ___
chisq_stat(response = ___, p = ___)
# Form null distribution
null <- ___
# Specify the response
___
# Set up the null hypothesis
___
# Generate 500 reps
___
# Calculate statistics
___